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Alkusanat 


Kielentutkimuksen menetelmiä on useita aloja käsittävä kielentutkimuksen 
menetelmiin keskittyvä teos opiskelijan ja tutkijan tueksi suomen kielel- 
lä. Teoksen keskeisenä päämääränä on esitellä ja selkiyttää menetelmäl- 
listen eli metodisten mahdollisuuksien kirjoa, menetelmällisten valin- 
tojen syitä ja seurauksia, menetelmien vahvuuksia ja heikkouksia sekä 
ylipäätään metodologisen ja laajemmin metateoreettisen tausta-ajattelun 
ilmaisemisen tärkeyttä kielentutkimuksessa. 

Perus- ja jatko-opiskelijoilta saadun palautteen perusteella kokoel- 
ma tulee tarpeeseen, sillä tieteenfilosofinen, metodologinen ja kielen- 
tutkimuksen menetelmiä koskeva yleinen teoreettinen koulutus on 
Suomessa paikoin turhan ohutta ja pirstoutunut eri suuntauksiin ja 
oppiaineisiin. Tämä eri yliopistoja, oppiaineita ja suuntauksia edusta- 
vien tutkijoiden yhteistyössä laatima hanke on yksi keino torjua kielen- 
tutkimuksen menetelmien ja metateorian opetuksen pirstaloitumista. 

Vaikka vakiintuneen normaalitieteen (ks. Kuhn 1962) harjoittami- 
nen on tieteellisen tiedon luomiseksi välttämätöntä, tutkijoiden on syytä 
perehtyä myös metodologiaan ja metateoriaan, jotta tiede uudistuisi ja 
kehittyisi. Metodologia harjaannuttaa eksplisiittiseen metodien kriitti- 
seen arviointiin ja perusteluun, ja metateoria selvittelee tutkimuksen 
taustoja, logiikkaa, rajauksia ja historiaa sekä muita tutkimukseen usein 
piilevästi vaikuttavia tekijöitä. Näitä asioita ei voi jättää hiljaisen tiedon 
varaan. Kielitieteen menetelmien ja metateorian laajaa esittelyä tarvitaan 
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myös välttämään suomalaisen kielentutkimuksen eklektisyyttä eli eri- 
laisten tutkimusperinteiden ja teorioiden yhdistelyä tutkimustyössä. 
Tällaisen yhdistelyn vuoksi tutkijan on kyettävä arvioimaan käyttämien- 
sä menetelmien taustateorioita ja niiden keskinäistä yhteensopivuutta. 
Eklektisyys ei ole kuitenkaan sama asia kuin monimenetelmäisyys tai 
monimenetelmäinen tutkimusasetelma, jotka kumpikin perustuvat tie- 
toisiin, ilmipantuihin metateoreettisiin ratkaisuihin. Fklektisyyttä voi 
kuvata teorioiden ja mallien käyttämisenä yhdessä ja samassa tutkimuk- 
sessa välttämättä tietämättä, ovatko ne keskenään ristiriidattomia. 

Kielentutkimuksen metateoria tarkastelee siis kielentutkimusta ni- 
mensä mukaisesti metatasolta. Metateorian voi jakaa normatiiviseen 
ja faktuaaliseen tai deskriptiiviseen tutkimukseen. Normatiivista tutki- 
musta on tieteenfilosofia, johon sisältyvät metodologia ja tieteen etiikka. 
Se pohtii sitä, millaisia piirteitä tieteellisessä tutkimuksessa tulee olla, 
jotta se täyttäisi tieteellisyyden kriteerit. Faktuaalista tai deskriptiivis- 
tä metateoriaa taas on tieteentutkimus, esimerkiksi kielitieteen sosio- 
logia, psykologia ja historia. Deskriptiivistä metateoriaa ei teoksessa juu- 
rikaan esitellä, sillä tämän kokoelman tavoite on nimenomaan tarjota 
lukijalle käsitteellisiä välineitä kielentutkimuksen tutkimusmetodien 
ja taustateorioiden arviointiin. Kielitieteen historiaa käsitellään artikke- 
leissa jonkin verran esiteltävän menetelmän ymmärtämiseksi. Kielen- 
tutkimuksen sosiologia ja psykologia jäävät käytännössä teoksen rajauk- 
sen ulkopuolelle. 

Yleisesti etuliitteellä meta- kuvataan ylempää tai abstraktimpaa näkö- 
kulmaa johonkin tarkasteltavaan asiaan. Esimerkiksi metatieto tarkoittaa 
tietoa tiedosta (esim. tutkimusaineiston metatiedot). Metakieli tarkoittaa 
toisen asteen kieltä, jolla puhutaan luonnollisesta kielestä tai objekti- 
kielestä. Esimerkiksi perinteinen kielenkuvausten kielioppitermistö on 
metakieltä usein jostakin yksittäisestä objektikielestä. Metateoria tarkoit- 
taa vanhastaan teoriaa teorioista. Metatutkimus on tutkimus, joka perus- 
tuu joukkoon muita, jotakin spesifiä aihetta käsitteleviä tutkimuksia, 
ja niin edelleen. Pidämme tärkeänä, että tarjolla on sellainen kielen- 
tutkimuksen menetelmällistä kirjoa tarkasteleva suomenkielinen teos, 
joka juuri metatasoisen käsittelyn kautta pyrkii tarjoamaan välineitä 
metodologisten ongelmien arviointiin. 
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Kielentutkimusta harjoitetaan erilaisten suuntausten piirissä ja niis- 
sä erilaisin eriytynein menetelmin. Kielentutkimuksen suuntaukset ja 
niiden parissa käytettävät tutkimusmenetelmät ovat kuitenkin siinä 
määrin kytköksissä toisiinsa, että niitä on usein lähes mahdotonta esi- 
tellä erikseen. Tähän vaikeuteen törmäsimme useaan otteeseen kokoel- 
maa valmistaessamme. Olemmekin joutuneet mahdollisesti tekemään 
tieteenalan totutulle jäsennykselle jonkinasteista väkivaltaa, sillä olem- 
me pyrkineet nimenomaan tarkempaan kielentutkimuksen metodo- 
logian kuvaukseen. Tämä pyrkimys on tarkoittanut sitä, että keino- 
tekoisia rajoja tutkimusmenetelmien ja suuntausten välillä on tehty tai 
jätetty tekemättä silloin, kun jotakin relevanttia metodologista meta- 
tietoa on kirjoittajien mielestä näin saatu tuotua esiin. 

Pyrkiessämme kuvaamaan kielentutkimuksen menetelmällistä kir- 
joa olemme yksittäisten menetelmien (kuten luonnollisen kielenkäytön 
havainnointi tai kielitaju) lisäksi ottaneet mukaan myös joitain yksit- 
täisten tutkimussuuntausten (kuten sosiolingvistiikka tai kielitypologia) 
kuvauksia silloin, kun näiden käyttämiä menetelmiä on mahdotonta 
käsitellä ilman tutkimussuuntauksen tuntemusta. Kielentutkimuksen 
menetelmiä ei siis tässä mielessä ole sama asia kuin esimerkiksi ”Kielen- 
tutkimuksen käsikirja” tai ”Kielentutkimuksen perusteet”, emmekä ole 
tässä teoksessa pyrkineet kuvaamaan kattavasti koko kielentutkimuksen 
tutkimussuuntausten ja tutkimusalojen kirjoa. Olemme hyvin tietoisia, 
että monia kielentutkimukselle keskeisiä aloja jää pääasiassa käytännön 
syistä tämän kokoelman ulkopuolelle. 

Ensiksi kokoelman tavoitteena ei ole tarjota yleiskuvaa kielitieteen 
sellaisista perustavista osa-alueista kuin fonetiikka, fonologia, morfo- 
logia, syntaksi, leksikologia, semantiikka tai pragmatiikka. Näitä esi- 
tellään kielentutkimuksen perusoppikirjoissa (esim. Karlsson 1998; 
Ojutkangas, Larjavaara, Miestamo & Ylikoski 2009) ja harjoitutetaan 
käytännön taidoksi kielitieteen peruskoulutuksessa. Näin ollen sellaisia 
analyysitekniikoita ja -perinteitä kuin foneemianalyysi (esim. yksiköi- 
den jakauma ja substituutio), morfeemianalyysi (esim. morfemisointi), 
syntaksin operationaaliset testit (esim. siirtotesti) sekä sanasemanttinen 
analyysi (homonymia, synonymia, polysemia), sanaluokkaluokittelu, 
semanttinen piirreanalyysi yms. ei käsitellä kattavasti tässä teoksessa. 
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Tulee kuitenkin muistaa, että tällainen kielen perusanalyysikin on 
pohjimmiltaan teoreettis-metodista toimintaa. Siksi teoksen tarjoamaa 
metateoreettisesti ja metodologisesti orientoitunutta lähestymistapaa 
kannattaa lukijan soveltaa myös tällaiseen perustutkimukseen. 

Toiseksi edellä mainituista kielitieteen perustavista osa-alueista on 
olemassa jo erittäin runsas alakohtainen peruskirjallisuus. Esimerkiksi 
fonologian ja morfologian kuvausmalleja on lukuisia, syntaksin kym- 
meniä. Lisäksi erilliset metodioppaat (esim. Tainio 1997) tai muut ala- 
kohtaiset yleisesitykset ovat usein tarkoituksenmukaisempia paikkoja 
metodisten yksityiskohtien käsittelyyn kuin valitsemamme yleisem- 
mällä tasolla liikkuva käsikirjamainen esitystapa. Tämän kokoelman 
tavoitteena on antaa yleiskatsaus kielentutkimuksen metodioppiin ja 
sen peruslähteisiin, ja siksi teoksen luvut pyrkivät haravoimaan kielen- 
tutkimuksen kenttää pragmaattisesti metodologisesta näkökulmasta. 
Kieliaineistot, kuvaustekniikat (tai metodit) ja kuvauskäsitteet muodos- 
tavat kielitieteen kaikessa toiminnassa läpikäyvän kolmikannan, jonka 
perusteita tieteenalan metodologia erittelee. Tämä kokoelma tarjoaa tä- 
hän yleiskuvan. Yksityiskohdissa lukijan on hyvä kääntyä erikoisalan 
kirjallisuuden puoleen (ks. Johdannon luku 5 tk). 


Tämän kokoelman sisältö on joka tapauksessa pyritty valitsemaan 
pragmaattisin perustein, ilman arvottavia latauksia. Samalla tavalla pi- 
dämme arvottamista tarpeettomana myös teoksessa kuvattujen eri me- 
netelmien välillä. Sen sijaan pidämme kielentutkimuksen menetelmiä 
toisiaan täydentävinä ja pyrimme kuvaamaan niitä niiden omista lähtö- 
kohdista käsin ja tunnistamaan niiden sovellusalat, heikkoudet ja vah- 
vuudet. On huomattava, että erilaisilla metodeilla tavoitellaan erilaista 
tietoa. Metodeilla on siten erilaisia heikkouksia ja vahvuuksia ainoas- 
taan ja erityisesti suhteessa asetettuihin tutkimuskysymyksiin. Tämän 
johdantoteoksen tavoitteena on tuoda opiskelijan ja tutkijan ulottuville 
tällaista olemassa olevaa standarditietoa metodeista. 

Terminologisesti kokoelman tavoitteena on objektiivinen, läpinäkyvä 
ja ei-arvottava esitys nykymetodologiassa käytetyistä käsitteistä. Pyrim- 
me painottamaan metodologian ja tieteenfilosofian nykykäsitteistöä. 
Tältä osin erityisesti kokoelman verraten laajan johdannon tavoitteena 
on tarjota myös uusia virikkeitä, koska tieteenfilosofiasta kirjoitetaan 
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suomalaisessa ja kansainvälisessä kielentutkimuksessa suhteellisen vä- 
hän. Metodologiaa koskeva termistö on määritelty keskeisiä tieteellisen 
käsitteenmuodostuksen perusperiaatteita noudattaen ja kattamaan koko 


teoksen (ks. Johdannon luku 1 tk.). Kokoelman luvuissa eri kirjoittajat il- 
maisevat erikseen, mikäli heidän metodinsa puitteissa käytetään termejä 
jossakin eriävässä merkityksessä. 

Kokoelmassa omaksuttu metateoreettinen lähestymistapa kulkee 
punaisena lankana läpi teoksen kaikkien lukujen. Teoksen jokaisessa 
luvussa pohditaan kyseisen menetelmän tai tutkimussuuntauksen esit- 
telyn yhteydessä sen historiaa, suhdetta lähialoihin sekä mahdollisia 
erityisiä eettisiä kysymyksiä. Tällaisen pohdinnan tarkoituksena on aut- 
taa lukijaa hahmottamaan paremmin kielentutkimuksen ja sen mene- 
telmien kokonaisuutta. Metateoreettinen lähestymistapa näkyy lisäksi 
kokoelman johdanto-osion kattavuutena ja runsaina teoksen sisäisinä 
viittauksina. Johdannossa korostetaan ja tuodaan konkreettisesti esiin 
myös metodologisen tason kysymysten tärkeyttä itsessään tavanomais- 
ten ilmiötutkimusten rinnalla. 

Kokoelma on suunnattu kielten perus- ja jatko-opiskelijoille, tutki- 
joille ja muille kielentutkimuksesta kiinnostuneille. Se valaisee kielen- 
tutkimuksessa käytettäviä menetelmiä ja niihin liittyviä tutkimus- 
prosesseja mahdollisimman käytännöllisesti ja havainnollisesti sekä 
avaa monia menetelmäkirjallisuudessa aikaisemmin vähemmälle huo- 
miolle jääneitä kohtia. Teoksessa käsitellään monia ajankohtaisia tieteen 
yhteiskunnalliseen asemaan liittyviä aiheita, kuten tutkimusetiikkaan, 
tietosuojaan ja avoimen tieteen periaatteisiin liittyviä kysymyksiä. Eri- 
tyisen hyvin teos soveltuu kielentutkimuksen menetelmäopetukseen, 
mutta se esittelee myös laajempia tieteelliseen tutkimukseen yleisesti 
liittyviä tieteenfilosofisia taustoja. 

Toimituskuntaa on johtanut Milla Luodonpää-Manni Markus Hamu- 
sen avustamana. 

Kokoelmaa laadittaessa osia siitä on lukenut ja kommentoinut koko 
joukko asiantuntijoita. Haluamme kiittää seuraavia ihmisiä — panok- 
sesta kommentoivana esilukijana tai muusta hyödyksi koituneesta 
neuvonannosta — sukunimen mukaisessa aakkosjärjestyksessä: Lotta 
Aarikka, Sonja Dahlgren, Anton Granvik, Viljami Haakana, Auli 
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Hakulinen, Sointu Järvinen, Annekatrin Kaivapalu, Fred Karlsson, 
Markus Lakaniemi, Jorma Luutonen, Arto Mustajoki, Urho Määttä, 
Tiina Onikki-Rantajääskö, Jarno Porkka, Jesse Salmi, Antonio 
Sciacovelli, Tuulia Sinervo, Ulla Vanhatalo ja Camilla Wide. Lisäksi kii- 
tämme Viljami Haakanaa lähdeluetteloiden tarkistamisesta sekä Nora 
Fabritiusta kaavioiden tekemisestä lukuun 15. Erikseen toimitus kiittää 
koko kirjoittajakuntaa vakuuttavasta sitoutumisesta laajaan yhteiseen 
hankkeeseen. Lämmin kiitos myös kustantajalle. Teoksen valmistumista 
on tukenut Otto A. Malmin lahjoitusrahasto sekä Helsingin yliopiston 
Nykykielten laitos (nykyinen Kielten osasto). 
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Tässä luvussa keskitymme tutkimuksenteon käytäntöön.* Etenemme 
tutkimuksenteon taustalla vaikuttavien tieteenfilosofisten ja metodo- 
logisten periaatteiden esittelystä aiheen valintaan, tutkimusstrategiaan, 
aineistonkeruuseen, aineiston analyysiin ja tulosten esittelyyn liittyviin 
kysymyksiin. Lopuksi pohdimme vielä, miten kielitieteen menetelmillä 
voidaan vastata ihmiskunnan suuriin haasteisiin. Johdannon luvuissa 
2 ja 3 käsittelemme syvällisemmin tieteellisen menetelmän periaatteita 
ensin yleisellä tasolla ja sitten erityisesti kielentutkimuksen näkö- 
kulmasta. Kielentutkimuksen etiikkaan syvennymme luvussa 4, joskin 
etiikkaan liittyviä aiheita sivutaan lyhyesti myös luvuissa 1 ja 2. Päätäm- 
me johdannon lukuun 5, jossa esittelemme tämän teoksen rakennetta 
sekä muita kielentutkimuksen metodioppaita. 


Kiitämme ulkopuolisia arvioijia ja kommentoijia sekä kokoelman muuta toimituskuntaa koko johdan- 
toa koskevista hyödyllisistä kommenteista. 
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1.1. Kielentutkimuksen kolme tasoa 


Tutkijan omaksumilla tieteenfilosofisilla ja metodologisilla peri- 
aatteilla on suuri vaikutus tutkimuksenteon käytäntöön, esimerkiksi 
siihen, miten aiheita, tutkimuskohteita ja menetelmiä valitaan ja käy- 
tetään. Tieteenfilosofiaksi kutsutaan sitä periaatteiden ja käsitysten 
joukkoa, joka ohjaa tieteen tekemistä. Tieteenfilosofia on luonteeltaan 
normatiivista ja kertoo, miten tiedettä tulisi tehdä. Se eroaa tieteen- 
tutkimuksesta, joka on deskriptiivistä ja joka kuvailee tiedeyhteisössä 
tapahtuvaa tosiasiallista toimintaa. Vastaava ero voidaan tehdä myös yk- 
sittäisen tieteenalan sisällä. Kielitieteen filosofia siis pohtii kielitieteen 
tutkimuskohteiden valintaa ja kielitieteessä käytettäviä menetelmiä 
tieteenfilosofian näkökulmasta ja kielentutkimuksen tutkimus, kuten 
kielentutkimuksen sosiologia tai historia, mitä kielentutkimuksessa tosi- 
asiassa tehdään tai on tehty. 

On korostettava, että esimerkiksi kielentutkimuksen filosofia mää- 
rittelee kielentutkimuksen yleiset pelisäännöt ja ne kriteerit, joilla ar- 
vioidaan tieteenalan menetelmien tieteellisyyttä. Kielentutkimuksen 
tutkimuksessa voidaan arvioida, kuinka näitä menettelytapoja noudate- 
taan. Kumpikaan näistä metateoreettisista tutkimusaloista ei säätele esi- 
merkiksi tutkimuksen yksittäisiä aihevalintoja tai tutkimuskysymyksiä, 
vaan niissä on kiinnostuttu muun muassa siitä, kuinka muotoillaan 
tutkimuskysymyksiä, kuinka tutkitaan tieteellisesti ja kuinka tutkimuk- 
sen tuloksia tulkitaan. Edellinen tarkastelee tätä normin, jälkimmäinen 
tosiasiallisen toiminnan kannalta. 

Sekä kielentutkimuksen filosofialla että kielentutkimuksen tutki- 
muksella on metanäkökulma kielentutkimukseen, ja tutkimusalueita 
voidaan nimittää yhteisellä nimellä kielentutkimuksen metateoria. Alla 
olevassa kuviossa 1 kieli ja sen tutkimus jaetaan neljään tasoon. Ta- 
son 1 muodostaa kielen ilmitodellisuus, josta raakadata tutkimukseen 
kerätään. Itse kielentutkimus operoi tasoilla 2-4. Metateorian tasolta 
4 kuvataan ja selitetään kielentutkimuksen teorioita ja metodeja (3). 
Tasolla 3 kuvatut teoriat ja metodit puolestaan koskevat kahden alem- 
man tason muodostamaa kokonaisuutta eli kieltä sellaisena kuin se 
reaalitodellisuudessa ilmenee (1) kielentutkimuksesta riippumatta sekä 
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kielenilmiöitä (2), jotka kielentutkimuksen yhteisö tai yksittäinen tutkija 
tunnistaa ja käsitteellistää tieteellisen kuvauksen, selitysten tai teorioi- 
den kohteeksi. 

Metateorian tutkimuskysymyksen voi kiteyttää seuraavasti: mitä on 
kielentutkimus, joka tarkastelee sitä, mitä on kieli? Metateoreettisella 
tutkimuksella on kielitieteessä usein juuri tarkoitettu esimerkiksi kah- 
den teoreettisen viitekehyksen, kuten kognitiivisen kielentutkimuksen 
ja generatiivisen kielentutkimuksen, perusteiden keskinäistä arviointia 
ja vertailua tai jonkin yksittäisen tutkimusalan perusteiden selvittelyä 
(jälkimmäisestä ks. esim. Määttä 1994). 

Metateoria tulee erottaa kielentutkimuksen lähestymistavoista, 
koulukunnista ja paradigmoista, joissa myös toteutetaan tietynlaista 
tutkimusperspektiiviä ja rajattua näkökulmaa kieleen ja tämän myötä 
usein myös valikoitunutta metodiikkaa. Koulukunnat rakentuvat usein 
ajallis-paikallisesti keskeisten tutkijoiden ja heidän seuraajiensa ympä- 
rille. Ne nimetäänkin usein prominentin tutkijan tai paikan mukaan 
(ks. esim. Sampson 1980). Termi paradigma on lähtöisin tieteenfilosofi 
Thomas Kuhnilta (ks. Kuhn 1994 [1962]; ks. myös Kiikeri & Ylikoski 
2004, 55-69). Hän tarkoittaa sillä tieteenalalla vakiintunutta ja jaettua 
näkemystä eli tieteellistä konsensusta siitä, mitä pidetään tutkimisen 
arvoisena, millaisia kysymyksiä esitetään ja miten tutkimusongelmia 
ratkaistaan ja tuloksia esitetään ja tulkitaan (myös Percival 1976). Tällai- 
siin valintoihin ja näkemyksiin liittyvät myös erilaiset tieteen tekemisen 
ohjausvaikutukset, tieteellinen vallankäyttö ja muut subjektiivisetkin 
tekijät (esim. Karlsson 1975). 

Metodologia eli menetelmäoppi on osa tieteenfilosofiaa, ja sillä tarkoi- 
tetaan tieteellisen metodin määrittelemistä, kehittämistä ja soveltamista 
koskevien periaatteiden ja ehtojen tutkimusta. Metodologiassa siis tut- 
kitaan tieteellistä menetelmää eli keinoja, joilla tieteellistä tietoa hanki- 
taan. Se on osa metateoriaa ja sijoittuu kuviossa 1 tasolle 4. Metodiikka 
taas on jollakin tieteenalalla käytössä olevien menetelmien, tutkimus- 
tekniikoiden ja välineiden joukko. Siihen kuuluvat ainakin aineiston ke- 
räämisen, kuvaamisen ja analyysin sekä päätelmien tekemisen tekniikat. 

Metodeilla eli tutkimusmenetelmillä viitataan niihin erityisiin kei- 
noihin, välineisiin ja tutkimustekniikkoihin, joiden avulla tutkimus- 
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METATEORIA (4) 
NORMATIIVINEN: kielentutkimuksen tieteenfilosofia, joka sisältää metodologian 
ja tutkimusetiikan 
FAKTUAALINEN: kielentutkimuksen historia, sosiologia, psykologia yms. 


TEORIAT JA METODIT (3) 
esim. generatiivinen kielioppi, historiallis-vertaileva menetelma, 
vuorovaikutuslingvistiikka, lingvistinen kenttätyöskentely, systeemis-funktionaalinen 
kielioppi, kielitypologia, haastattelu, laadullinen tutkimus, kognitiivinen kielioppi, 
tilastomenetelmät, kielitaju, naturalistinen observointi, maallikkokielenpuhujan 
konsultointi (eli elisitaatio), aineiston litterointitavat, muut ilmiön ja tulosten 
kuvaamistavat (taulukot, kuviot, formalisointi ja notaatiotavat yms.)jne. 


ORENSE p] esee ctsisceetoce mos egt 


KIELENILMIOT (2) 
esim. ranskan subjunktiivin käyttö, suomen -kin-liitepartikkeli puheessa, 
duaali maailman kielissä, ajan liikemetaforat slaavilaiskielissä, pörssitiedotteiden 
kielenkäyttö, Juvan vanhimmat paikannimet, futuurisuuden ilmaiseminen Ruotsin 
viittomakielessä, selkokielen lauserakenteet, nykytietokirjallisuuden kääntäminen, 
silmien liike luettaessa jne. 


puhuminen ja kuunteleminen tai viittominen ja viittomien tulkinta (kieli toimintana, 
transitorisena prosessina) 

kirjoittaminen ja lukeminen (kieli toimintana, joka tuottaa tekstin) 

puhutut ja kirjoitetut tekstit (kieli objektina, reifikaatio) 

kieltajun ilmentymät 


KIELI (1) 


Kuvio 1. Kieli ilmentymineen (1) sekä kielentutkimuksen kolme tasoa (2—4). 


kohteesta pyritään hankkimaan tieteellistä tietoa. Kielentutkimuksessa 
menetelmällisiä välineitä tarjoavat myös monet teoriat ja mallit (ks. ku- 
vion 1 tasoa 3). Metodien valintaan vaikuttavat ainakin tutkimuskohde 
ja tutkimuskysymykset sekä tutkimuksen taustalla olevat metodologiset 
periaatteet. Yksittäisistä metodeista ei siten ole mielekästä puhua poh- 
timatta tutkimuksenteon taustalla vaikuttavaa laajempaa menetelmä- 
oppia. Olemmekin pyrkineet avaamaan keskeisimpiä tieteenfilosofisia 
ja metodologisia periaatteita johdannon luvussa 2. 

On huomattava, että käytännössä metodologian ja metodiikan erossa 
pitäminen voi olla hankalaa ainakin kahdesta syystä. Ensinnäkin tieteen- 
alan eri lohkojen taustateoriat ovat saattaneet rakentua siinä määrin eri 
lähtökohdista, että termejä on voitu käyttää hieman eri merkityksissä 
eri suuntausaloilla. Toiseksi metodologiaa ei usein voi käsitellä ilman 
metodiikkaa ja toisin päin. Näistä syistä teoksen lukujen kesken on 
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mahdollista huomata terminologisia konnotaatio- ja sävyeroja, vaikka 
tavoitteenamme on noudattaa tässä annettuja standardimääritelmiä. 

Kuviossa 1 kieli (1) ja kielenilmiöt (2) on erotettu toisistaan. Kieli 
on monitahoinen ilmiö, jonka avulla ihminen ajattelee, viestii ja toi- 
mii vuorovaikutuksessa ympäröivän maailman kanssa. Kieli (1) ilme- 
nee toimintana, kuten puhumisena ja viittomisena, kuuntelemisena 
ja viittomien havaitsemisena ja tulkitsemisena sekä kirjoittamisena ja 
lukemisena. Kieleen kuuluvat myös puhutut ja kirjoitetut tekstit. Tällä 
tasolla toimitaan kielellisesti arkisessa elämässä: vuorovaikutuksessa 
toisten kanssa, tekstiä luettaessa, puhetta suunniteltaessa, sanavalintoja 
mietittäessä jne. Tämä taso 1 on olemassa todellisuudessa kielen- 
tutkimuksesta huolimatta, ja sen voidaan ajatella muodostavan todelli- 
suuden tason, johon kielentutkimus viime kädessä kohdistuu. Tasojen 
1 ja 2 tosiasiallisessa erossa pitämisessä on samoja hankaluuksia kuin 
metodologian ja metodien kesken edellä, mutta käsitteellisenä eron- 
tekona se on tarpeen. 

Kun kieli (1) jossain edellä kuvatussa ilmenemismuodossaan vali- 
taan tutkittavaksi, siitä tulee kielenilmiöiden (2) tutkimusdataa. Tavan- 
omaisen kieliopin perusrakennetta kuvaavan kielentutkijan (engl. 
ordinary working grammarian) teoreettis-metodinen toiminta esimerkiksi 
naturalistisessa havainnoinnissa perustuu kieli-ilmiöiden tunnista- 
miseen, luokittamiseen ja problematisoimiseen. Kielenilmiöt teoreti- 
soituvat, abstrahoituvat ja pelkistyvät, sillä alkuperäinen kielenaines 
(raakadata, ks. Johdannon luku 1.4. tässä kirjassa) saatetaan tutkimus- 
aineistoksi erilaisin metodisin ja käsitteellisin keinoin. Tämä koskee 


erityisesti puhuttua kieltä. Kun ohimenevää ja kertaluonteista kielen- 
käyttötilannetta ääni- tai videotallennetaan myöhemmin tarkasteltavaksi, 
alkuperäisestä tilanteesta menetetään aina jotain. Videokuvaus tapahtuu 
jollakin kuvanrajauksella sekä jostakin näkökulmasta. Äänitallenteessa 
kuullaan vain äänet. Lisäksi erilaiset tallennus- ja informaation- 
pakkausmuodot sekä aineiston siirto- ja konvertointityöt saattavat 
redusoida dataa lisää. Esimerkiksi käytetty tiedonpakkausmenetelmä 
voi heikentää tallenteen äänenlaatua ja vaikuttaa siihen, millaista tutki- 
musta aineiston varassa voidaan tehdä (ks. Kokeellinen fonetiikka tk.). 
Analysoinnin helpottamiseksi puhutun kielen aineistoja, eli ääni- ja 
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videodataa, yleensä myös tekstinnetään (litteroidaan, transkriboidaan, 
tarkekirjoitetaan) luettavaan muotoon jollakin enemmän tai vähemmän 
vakiintuneella merkintätavalla. Kielentutkimuksen eri aloilla tähän on 
erilaisia transkriptio- ja litterointimenetelmiä ja -perinteitä, joissa esi- 
merkiksi vuorovaikutuksen eri puolia (päällekkäispuhunta, tauot, eleet, 
ilmeet, asennot yms.) tai puheen foneettisen laadun tarkkuusasteita 
(erilaiset foneettiset tarkkeet) voidaan merkitä systemaattisesti näkyviin 
(ks. Haastattelu aineistonkeruun metodina sosiolingvistiikassa; Keskus- 
telunanalyysi ja vuorovaikutuslingvistiikka tk.). Litterointitapa ja tran- 


skription hienous tai karkeus määräytyvät usein tutkimuskysymyksistä 
tai jonkin laajemman korpuksen koontiperiaatteista. Puheen tekstintä- 
minen kuitenkin joka tapauksessa muuttaa, abstrahoi ja pelkistää aineis- 
toa merkittävästi sen muuttaessa olomuotoaan puheesta tekstiksi. Matka 
kielen tasolta 1 (esim. puheen virrasta) teorioiden ja metodien tasolle 
3 johtaa aina kielenilmiöiden (2) idealisoitumiseen sekä katsantotavan 
abstrahoitumiseen ja teoretisoitumiseen. 

Edellä kuvatut tekstintämismetodit koskevat usein äidinkieltä tai 
tilannetta, jossa kielen perusrakenne tunnetaan jo. Toinen, edellistä 
perustavampi vaihe tekstintämisessä on se, kun aikaisemmin kuvaa- 
mattoman kielen kieliopin perusrakennetta kuvataan ensimmäistä ker- 
taa. Tämä käsittää ennen kaikkea yksittäiskielen kaksoisjäsennyksen 
avaamista (ks. Martinet 1964, 22—24). Kaksoisjäsennys on luonnollisen 
kielen ominaisuus. Ensimmäinen jäsennys koskee sitä, että puheen 
virrasta tunnistetaan ja erotellaan kielen muoto-merkitysyksiköt eli 
morfeemit, joista laaditaan luettelo ja keskinäistä yhdistämistä koskevat 
säännöt (metodista esim. Nida 1949; Harris 1957 [1951], luvut 12-19). 
Toinen jäsennys koskee muoto-merkitysyksiköiden rakenneanalyysia 
pienempiin yksiköihin eli merkitystä erotteleviin foneemeihin, kielen 
foneemijärjestelmän hahmottamista ja foneemien keskinäistä yhdis- 
tämistä koskevien sääntöjen laatimista (metodista esim. Pike 1966 
[1947]). Kaksoisjäsennyksen analyysi on jo kielen teoreettista kuvaamis- 
ta. Se on myös edellytys puheen litteroimiselle tai transkriboimiselle 
esimerkiksi kielellisen vuorovaikutuksen ja sosiolingvististen seikko- 
jen tutkimiseksi." (Ks. Johdatus kielitieteeseen, Ojutkangas, Larjavaara, 
Miestamo & Ylikoski 2009.) 
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Kuviossa 1 kielenilmiöiden tasoa 2 voidaan kutsua siksi yleistettävien 
ilmiöiden joukoksi, jonka kielentutkimuksen yhteisö tunnistaa tieteel- 
lisen kuvauksen, selitysten tai teorioiden kohteeksi. Yksittäisten kielen- 
ilmiöiden tasolle tultaessa kielen teoreettis-metodista analyysia on siis jo 
tutkimuksen alkamishetkellä välttämättä olemassa. Esimerkiksi ranskan 
subjunktiivin käytön tutkiminen edellyttää monien teoreettisten termien 
ja väitteiden omaksumista. Väitteessä ”ranskan verbi veuille on subjunk- 
tiivi” muoto veuille on kaksoisjäsennyksen analyysin tulos ja ranska (kie- 
li), verbi sekä subjunktiivi ovat termejä teoreettisille käsitteille, jotka on 
erikseen määriteltävä. Tällaiset yksittäiset väitteet ovat oikeastaan jo mi- 
nimaalisia teorioita (teoriapartikulaareja), joiden muodostamista koko- 
naisuuksista muodostuu kielten teoreettisia osa- tai kokonaiskuvauksia 
(ks. Kielten dokumentointi ja kieliopin kuvaus; Kieliopin tutkimus ja 


kielioppiteoriat tk.). Kielentutkimuksen kuvausten, selitysten ja teo- 
rioiden kohteena olevat kielenilmiöt (2) eroavat siten arkisessa elämässä 


esimerkiksi puheen virtana havaittavasta, lingvistisesti analysoimatto- 
masta kielenaineksesta (1). 


Tässä teoksessa käytettyjen metodologisten termien merkitykset 


Meta- on etuliite, jolla kuvataan ylempää abstraktimpaa näkökulmaa 
kohteeseen. Metatieto tarkoittaa tietoja tiedosta, metakieli toisen as- 
teen kieltä (K2), jolla puhutaan luonnollisesta kielestä (K1), metateoria 
tarkoittaa teoriaa teorioista, metamatematiikka tutkii matematiikan alan 
kysymyksiä jne. 


Tieteenfilosofia tutkii tieteen ja tieteellisen tiedon ehtoja. Tieteenfilosofia 
on normatiivista, ja se kertoo, miten tiedettä tulisi tehdä. Yleisen tieteen- 
filosofian lisäksi siitä voidaan erottaa yksittäisiä tieteenaloja koskevia 
tieteenfilosofioita. Kielentutkimuksen tieteenfilosofiaksi kutsutaan sitä peri- 
aatteiden ja käsitysten joukkoa, joka ohjaa kielentutkimuksen tekemistä. 


Metodologia eli menetelmäoppi tutkii metodien filosofisia ja loogisia 
perusteita. Metodologia on osa tieteenfilosofiaa, ja sillä tarkoitetaan 
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tieteellisen menetelmän määrittelemistä, kehittämistä ja soveltamista 
koskevien periaatteiden ja ehtojen tutkimusta. Metodologiassa tutkitaan 
siis tieteellistä menetelmää eli keinoja, joilla tieteellistä tietoa hankitaan. 
Metodologia tarjoaa siten välineitä menetelmällisten valintojen perus- 
teluun. 


Metodiikka on jollain tieteenalalla käytössä olevien tieteellisten mene- 
telmien, tutkimustekniikoiden ja välineiden joukko. Metodiikka voidaan 
jakaa ainakin seuraavaan neljään osaan: aineiston keräämisen tekniikat, 
aineiston kuvaamisen tekniikat, aineiston analyysin tekniikat ja päätel- 
mien tekemisen tekniikat. Metodologian ja metodiikan keskinäinen eros- 
sa pitäminen on sikäli hankalaa, että molemmat edellyttävät toisiaan. 


Metodi eli tutkimusmenetelmä on tieteellinen tutkimusprosessi, joka 
johtaa tieteelliseen tietoon. Metodeilla viitataan niihin erityisiin keinoihin, 
välineisiin ja tutkimustekniikkoihin, joilla tutkimuskohteesta pyritään 
hankkimaan tieteellistä tietoa. 


Tutkimustekniikka on tieteellisen tutkimusprosessin konkreettinen osa, 
jollaisia ovat esimerkiksi otantatekniikka, haastattelu- tai kyselytekniikka, 
numeeristen aineistojen muodostaminen ja erilaiset tilastolliset mene- 
telmät. 


Tieteenfilosofia 


Metodologia 


Metodiikka 
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Teoria on lauseiden joukko, joka muodostaa yhtenäisen kuvauksen jos- 
takin ilmiöstä. Teorioita on eritasoisia. Kielentutkimuksessa yksittäisen 
teorian voi muodostaa vaikkapa joukko tietyn kielen kielioppia koske- 
via väitteitä, jotka muodostavat kielen teoreettisen osa- tai kokonais- 
kuvauksen. Taustateorialla viitataan puolestaan tutkimuksessa käytettyyn 
laajempaan teoriaan tai tietopohjaan, joka antaa kuvauksen kohteestaan 
ja kertoo kohteesta suhteessa muihin todellisuuden ilmiöihin. 


1.2. Aiheen valinta ja tutkimuksen teoreettinen tausta 


Tutkimusaiheen valinta ja alustava tutkimuskysymysten määrittely ovat 
tutkimuksenteon jännittävimpiä ja usein myös haastavimpia vaiheita. 
Tutkimusideat voivat kummuta esimerkiksi tutkijan omista kokemuk- 
sista ja aikaisemmista tutkimuksista, tai ne voivat tulla annettuina esi- 
merkiksi tutkimusprojektissa, jonka osaksi tutkija liittyy. Hyvin tavallista 
on, että tutkija saa idean tutkimukselleen lukemalla muiden tutkijoiden 
aikaisemmin tekemiä tutkimuksia. Hän voi esimerkiksi havaita tutki- 
muksessa aikaisemmin kartoittamattoman aukon, jonka hän nyt haluaa 
selvittää. Tutkija voi myös pyrkiä testaamaan muiden tutkijoiden esittä- 
mien teorioiden toimivuutta erilaisissa aineistoissa. 

Henkilökohtaisten tekijöiden lisäksi aiheen valintaan vaikuttavat 
myös yhteisölliset tekijät. Esimerkiksi kielentutkimuksessa eri tutkimus- 
perinteillä on usein omat tapansa käsitteistää kieltä tutkittavana ilmiö- 
nä. Tällainen alustavakin tutkittavan ilmiön määrittely vaikuttaa siihen, 
millaiset tutkimusaiheet näyttäytyvät kyseisessä tutkimusperinteessä 
mielekkäinä ja mitkä eivät. Kielentutkimuksessa kohteena ei ole näin 
ollen kieli tai jokin yksittäinen osa kieltä sinänsä vaan kieli jostain näkö- 
kulmasta tarkasteltuna. (Ks. Longino 1990, 98-102.) Erilaisia näkö- 
kulmia kieleen ja kielellisten ilmiöiden tarkasteluun esitellään tämän 
kokoelman luvuissa 1-24. 

Tutkimusidean hiominen varsinaiseksi tutkimusaiheeksi on tyypilli- 
sesti monivaiheinen prosessi. Hyvän tutkimusaiheen ominaispiirteenä 
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voidaan pitää ainakin sitä, että aihe on sellainen, että sitä ylipäänsä on 
mahdollista tutkia. Tämä tarkoittaa esimerkiksi sitä, että tutkimusaiheen 
kartoittamiseen vaadittavaa aineistoa on saatavilla ja sitä on mahdollis- 
ta kerätä ja analysoida käytettävissä olevan ajan ja resurssien rajoissa. 
Etenkin aloittelevien tutkijoiden tutkimusaiheet ovat usein aluksi var- 
sin laajoja ja osin vielä määrittymättömiä, ja niitä hiotaan täsmällisem- 
miksi tutkimuksen kuluessa, kun tutkijan ymmärrys aiheesta kasvaa. 
Tutkimusaiheen määrittelyssä myös muilta tutkijoilta ja mahdollisilta 
tutkimustyön ohjaajilta saatu palaute on usein arvokasta. Onkin hyvä 
huomata, että käytännön tutkimusprosessissa tutkimuksen eri vaiheet 
ovat aktiivisia samanaikaisesti eikä yhtä vaihetta suljeta pois, kun siirry- 
tään seuraavaan. Esimerkiksi tutkimusaihe laajenee, rajautuu ja tarken- 
tuu koko prosessin ajan. Aiheenvalinta on tavallaan valmis vasta, kun 
tutkimus on valmis. 

Toinen hyvän tutkimusaiheen ominaispiirre on se, että aiheen tutki- 
mista voidaan pitää jollain tavalla merkityksellisenä. Etenkin tutkimus- 
rahoitusta hakiessaan tutkijan tulisi pystyä perustelemaan mahdollisim- 
man selkeästi, miksi aihe on tutkimisen arvoinen. Perustutkimuksen 
osalta olennaista on osoittaa, kuinka tutkimus lisää tietoa ja ymmärrystä 
aihepiiristä. Tutkimuksella voi olla myös soveltavampaa yhteiskunnallista 
merkitystä. (Ks. Creswell 2014, 27; myös Johdannon luku 1.6. tk.) 


Yksi tapa tarkastella tutkimuksen merkitystä on suhteuttaa se ai- 
kaisempiin tutkimuksiin. Tutkimuksen kirjallisuuskatsauksella on 
tässä keskeinen rooli, joten siihen kannattaa panostaa. Kirjallisuus- 
katsauksessa tutkija sitoo tutkimuksensa aiheesta käytyyn aikaisempaan 
tieteelliseen keskusteluun kertaamalla, millaisia tutkimuksia aiheesta 
on aikaisemmin tehty. Samalla hän voi osoittaa mahdollisia aukkoja ja 
puutteita aikaisemmassa tutkimuksessa sekä perustella, millaisia uusia 
metodologisia, teoreettisia ja käytännöllisiä näkökulmia hänen tutkimuk- 
sensa alalle tarjoaa. Hyvä kirjallisuuskatsaus ei siis tyydy luettelemaan 
aikaisemmin tehtyjä tutkimuksia vaan pohtii kriittisesti niiden vahvuuk- 
sia ja heikkouksia. Oman tutkimuksen suhteuttaminen aikaisempaan 
tutkimukseen on olennainen osa tieteellistä käytäntöä, ja se mahdollis- 
taa tutkimuksen merkityksen arvioimisen. Yksittäisten tiedonmurusten 
merkitystä on vaikea arvioida, ellei niitä voida suhteuttaa mihinkään 
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aikaisempaan tutkimustietoon. Muiden tutkijoiden tekemän työn kun- 
nioittaminen ja asianmukainen huomioiminen omassa tutkimuksessa 
ovat myös keskeinen osa hyvää tieteellistä käytäntöä (TENK 2012). 

Kiinteä osa kirjallisuuskatsausta on tutkimuksen teoreettisen taustan 
määrittely. Tutkimuksen teoreettinen tausta kertoo, millaisessa käsite- 
järjestelmässä kohdetta on tulkittu. Taustateorialla viitataan tutkimuk- 
sessa käytettyyn teoriaan, joka antaa kuvauksen kohteestaan ja kertoo 
kohteesta suhteessa muihin todellisuuden ilmiöihin. Taustateoria si- 
sältää ontologisia sitoumuksia, ja viime kädessä juuri näiden kohteen 
luonnetta koskevien oletusten yhteensopivuus metodologisten oletusten 
kanssa kertoo, onko menetelmällä saatu tieteellistä tietoa. Johdannon 
luvussa 2 käsitellään laajemmin sitä, mitä tarkalleen ottaen tarkoitetaan 
ontologisilla sitoumuksilla ja miten ne vaikuttavat metodologiaan. Yleis- 
täen voidaan sanoa, että käsitykset siitä, mitä ja millaisia ilmiöitä maail- 
massa on, vaikuttavat käsityksiin keinoista saada tietoa noista ilmiöistä. 
Taustateoria ohjaa tutkimusta monilla tasoilla: mitä tutkimuskohteesta 
havainnoidaan, mitä tutkimuksessa pidetään tärkeänä ja mihin siinä 
kiinnitetään huomiota. Se tarjoaa käsitteitä, joilla kohdetta luokitellaan, 
ja ohjaa siten perustavalla tavalla tulosten tulkintaa. Samalla teoria ri- 
kastaa aiheesta käytyä pohdintaa sitomalla tutkimustulokset laajempaan 
kontekstiin, minkä ansiosta niiden arvoa on mahdollista tarkastella. 
Taustateoria tarjoaa siis tutkijalle välineitä käsitellä tutkittavaa ilmiötä 
systemaattisesti ja antaa selitysmalleja tutkimustulosten tulkintaan (se- 
littämisestä ks. Johdannon luku 3 tk.; Eskola & Suoranta 1999, 80; ks. 
myös Creswell 2014, 51-76). 


Teorioita käytetään laadullisessa ja määrällisessä tutkimuksessa (ks. 
Johdannon luku 1.3. tk.) kuitenkin usein hieman eri tavalla. Laadullisessa 


tutkimuksessa teoria yleensä tarjoaa tutkimukselle näkökulman, josta 
tutkimuskohdetta lähestytään, kun taas määrällisissä tutkimuksissa on 
yleisempää testata teorioita. Uusi teoria tai käsite voi olla myös laadul- 
lisen tutkimuksen tulos. (Ks. esim. Creswell 2014, 51-76; Luodonpää- 
Manni 2016.) Teorian erilaisista rooleista johtuu, että termillä teoria voi- 
daan viitata myös hieman erilaisiin kohteisiin. Yhtäältä teorialla voidaan 
tarkoittaa ilmiön systemaattista esitystä (vrt. Kerlinger 1979, 64), joka on 
suhteellisen kattava, yhtenäinen ja vakiintunut tietorakennelma (esim. 
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prototyyppiteoria, puheaktiteoria, jokin yksittäinen kielioppiteoria jne.). 
Toisaalta teoriaksi tai teoreettiseksi viitekehykseksi voidaan kutsua tutkimuk- 
sen taustalla vaikuttavaa tietopohjaa, joka voi koostua eri lähteistä kerä- 
tyistä teoreettisista ja metodologisista periaatteista. Tällainen teoreettinen 
eklektismi on ollut tavallista suomalaisessa kielentutkimuksessa, jossa 
on vanhastaan usein vältetty sitoutumasta johonkin yksittäiseen teoriaan 
ja sen sijaan tutkimuksen teoriatausta on koostettu useista eri lähteistä. 
(Luodonpää-Manni 2016.) Eklektisen otteen omaksumisessa keskeistä on 
kuitenkin varmistaa, että taustateorioiden premissit, kategoriaoletukset 
ja loogiset implikaatiot ovat keskenään yhteensopivia. Teoria voi tarkoit- 
taa kielentutkimuksessa myös yhden viitekehyksen mukaisesti laadittua 
kokonaiskuvausta kielestä (esim. systeemis-funktionaalinen kielioppi tai 
konseptuaalinen semantiikka). Tällaiset kuvaukset muodostuvat kokoel- 
masta teoreettisia väitteitä (esim. -ssA on suomen inessiivi), jotka ovat 
teoriapartikulaareja (ks. Johdannon luku 1.1. tk.). 

Vaikka onkin mahdollista olla sitoutumatta mihinkään yksittäiseen 
teoreettiseen rakennelmaan, on hyvä huomata, että tutkijan aikaisemmat 


tiedot ja teoreettinen tausta ohjaavat havainnointia tarjoamalla käsitteet 
tutkittavan ilmiön tarkastelulle (Niiniluoto 1980, 224-225; ks. myös Joh- 
dannon luku 1.1. tk.). Esimerkiksi kieliopin ilmiöistä olisi vaikea puhua 
tukeutumatta aikaisemmassa tutkimuksessa käytettyihin käsitteisiin. 


Vaikka eri teorioissa käytettävät käsitteet olisivatkin lähellä toisiaan, niillä 
on joka tapauksessa historiansa ja käyttötapansa, jotka eivät välttämättä 
sovellu esimerkiksi uusien empiiristen löydösten kuvaamiseen suoraan. 
Kielenkuvaus johtaa näin välttämättä teoretisoimiseen. Lisäksi tutkimus- 
menetelmät, jopa tekniset työkalut, perustuvat teoreettisille olettamuk- 
sille, jotka ohjaavat sitä, millaisia tuloksia menetelmillä on mahdollista 
saada (esim. Latour & Woolgar 1986 [1979]). Kokenut tutkija tiedostaa 
omat taustaoletuksensa ja tuo ne tutkimuksessaan esille. 

Meinefeldin (2004, 153—154) mukaan tutkijan aikaisemman tiedon 
vaikutusta havainnointiin voidaan pyrkiä kontrolloimaan ainakin kah- 
della eri tavalla. Aikaisemmat tiedot voidaan yhtäältä tehdä eksplisiit- 
tisiksi hypoteesien (ks. Johdannon luku 1.3. tk.) muodossa, jolloin ai- 


kaisemman tiedon vaikutuksia tutkimuksen kulkuun voidaan arvioida 
avoimesti. (Ks. myös Creswell 2014, 51-68.) Toisaalta aikaisemman 
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tiedon vaikutusta tutkimuksen kulkuun voidaan pyrkiä kontrolloimaan 
päinvastaisella strategialla, välttämällä tutkimusta ohjaavien, aikaisem- 
paan tietoon perustuvien hypoteesien esittämistä. Tämä strategia on käy- 
tössä esimerkiksi ns. aineistovetoisissa tutkimuksissa (ks. Johdannon 
luku 3.3.2. tk.), joissa myös tutkimuskysymys usein johdetaan aineistos- 
ta. Tutkimustulokset eivät kuitenkaan nouse aineistosta itsestään, vaan 
kaikki tutkimus — niin teorialähtöinen kuin aineistolähtöinen — vaatii 
tutkijan tekemää tulkintaa (ks. Meinefeld 2004, 155). Tämä tulkinta ei 
tapahdu koskaan tyhjiössä, vaan siihen vaikuttaa esimerkiksi tutkijan 
saama koulutus. 

Viime kädessä taustaoletusten rooli tiedon rakentumisessa ei kui- 
tenkaan ole pelkästään yksittäisen tutkijan tai menetelmän vastuulla, 
vaan tiedeyhteisö määrittää lopulta sen, millaisia merkityksiä tieteel- 
liseksi tiedoksi hyväksyttyihin väitteisiin jää ja mitkä niistä poistetaan: 
tieteen intersubjektiivisuus takaa sen, että lauseiden totuusarvo säilyy 
arvonäkökulmista huolimatta (Longino 1990, 216). 


1.3. Tutkimusstrategia 


Tutkimusaiheen valinnan ohella tutkimusstrategian määrittely on 
keskeinen osa tutkimusta pohjustavaa suunnitteluvaihetta. Tutkimus- 
strategia on yksittäistä metodia tai tutkimustekniikkaa laajempi mene- 
telmällisten valintojen kokonaisuus, joka ohjaa tutkimuksen toteutus- 
ta. Tällaiset tutkimusstrategiset valinnat koskevat muun muassa sitä, 
käytetäänkö tutkimuksessa laadullisia, määrällisiä vai kenties moni- 
menetelmäisiä lähestymistapoja, onko kyseessä vähän tutkittua aluetta 
kartoittava eksploratorinen tutkimus vai aikaisempia teorioita testaava 
konfirmatorinen tutkimus, onko kyseessä tapaustutkimus, vertaileva tut- 
kimus jne. Tutkimusstrategiaan liittyvät menetelmälliset ratkaisut ovat 
tiukasti kytköksissä myös aineiston valintaan ja tutkimuskysymyksiin, 
sillä erilaiset menetelmät soveltuvat erilaisille aineistoille ja vastaavat 
erilaisiin tutkimuskysymyksiin (ks. Johdannon luku 3 tk.). 


Laadullisissa eli kvalitatiivisissa tutkimusstrategioissa tutkimus- 
kohdetta, sen ominaisuuksia ja merkityksiä pyritään ymmärtämään 
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kokonaisvaltaisesti. Se on omiaan aikaisemmin vain vähän kartoitet- 
tujen tutkimusalueiden tarkastelussa ja erityisesti silloin, kun se kos- 
kee ihmisen kokemusta ja sosiaalista toimintaa. Tutkimusstrategian 
kokonaisvaltaisen luonteen takia laadulliseen tutkimukseen soveltu- 
vat usein pienemmät aineistot kuin määrälliseen tutkimukseen. Esi- 
merkiksi tapaustutkimuksessa voidaan syventyä yksilön tai pienen 
ryhmän kielelliseen viestintään ja tuottaa näin näyttöä aikaisemmin 
muodostetun kieltä koskevan väitteen tueksi tai sitä vastaan. Laadulli- 
sessa tutkimuksessa ratkaisevaa ei ole aineiston (pieni) koko vaan niiden 
laadullisten tutkimuskysymysten luonne, joihin tutkimuksen kulues- 
sa pyritään vastaamaan. Laadullisen tutkimuksen ominaispiirteitä ovat 
usein analyysin syvyys, rikkaus ja perusteellisuus, mikä lisää teoreettista 
ymmärrystä ilmiön luonteesta. (Laadullisesta tutkimuksesta ks. esim. 
Syrjäläinen, Eronen & Värri 2007.) Kielentutkimuksessa laadulliset 
menetelmät soveltuvat esimerkiksi kielellisten ilmiöiden kuvaukseen 
ja sen selvittämiseen, mikä kielessä ylipäänsä on mahdollista. Kielen- 
tutkimuksessa on perinteisesti käytetty laadullisia menetelmiä, jotka 
ovat perustuneet tutkittavan ilmiön luokitteluun ja sitä koskevien ha- 
vaintojen tulkintaan aineistojen tai kirjallisuuden valossa. Teknologinen 
kehitys on kuitenkin helpottanut laajojen korpusaineistojen keräämistä 
ja käsittelyä (ks. Korpusaineistot tk.). Samalla kielentutkimuksen koh- 


teita on alettu käsitellä yhä enemmän myös määrällisestä näkökulmasta. 

Määrällisissä eli kvantitatiivisissa tutkimusstrategioissa tutkimus- 
kohdetta ja sille ominaisia piirteitä pyritään selittämään mittaamisen 
avulla. Määrällisen tutkimuksen perustana on vahva teoria, joka mah- 
dollistaa tarkasteltavien yksiköiden operationalisoinnin eli saattamisen 
mahdollisimman tarkasti mitattavaan muotoon (ks. Johdannon luku 


1.5. tk.). Määrällinen tutkimus soveltuu laajojen aineistojen analyysiin 
ja erilaisten muuttujien välisten suhteiden tarkasteluun. Lisäksi voidaan 
tarkastella vaikkapa yksittäisen muuttujan ilmenemistä eri ryhmien vä- 
lillä ja tuottaa näin tietoa, jota ei olisi voitu saada ilman ryhmien välistä 
vertailua. (Määrällisestä tutkimuksesta ks. esim. Töttö 2000.) Kielen- 
tutkimuksessa määrällisellä tutkimuksella selvitetään usein kielellisen 
ilmiön yleisyyttä ja säännönmukaisuuksia. Myös laadullisessa tutkimuk- 
sessa voidaan ilmaista määrällisiä tietoja. Määrien ilmaisu ei sinällään 
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vielä kerro, onko kyseessä määrällinen vai laadullinen tutkimus, vaan 
keskeistä on, onko tutkimuskysymys laadullinen vai yleisyyttä koskeva: 
johdetaanko yksittäistapauksista yleistyksiä (induktio) vai päätelläänkö 
mittaustuloksista ilmiöitä koskevia piirteitä (deduktio) (induktiivises- 
ta ja deduktiivisesta päättelystä ks. tarkemmin Johdannon luku 1.5. tk.; 
Niiniluoto 1983). 


Käytännöllisestä näkökulmasta määrälliset ja laadulliset menetelmät 
voidaan nähdä toisiaan täydentävinä lähestymistapoina (ks. Creswell 
2014, 10-11). Usein näkökulmat vuorottelevat jopa samassa tutkimuk- 
sessa. Erilaiset tutkimusnäkökulmat rikastuttavat tietoa tutkimus- 
kohteesta. Tutkimusnäkökulmia voidaan jakaa esimerkiksi sen mukaan, 
missä määrin ne objektivoivat kohdettaan tai missä määrin kohteen 
subjektiivinen ääni on tutkimuksessa esillä (ks. kuvio 2). Tutkijan on 
erilaisia metodologisia jakoja pohtiessaan arvioitava ainakin kahta asiaa: 
1) mitä päämäärää jako palvelee, ja 2) mitä alaa ajatellen jako on alun 
perin tehty. Yleinen käsitys ihmistieteissä — joihin luetaan humanistis- 
yhteiskuntatieteelliset tutkimusalat laajasti ymmärrettynä — on, että 
tutkimuskohdettaan havainnoiva ja luokitteleva tutkija katsoo sitä ikään 
kuin ulkoapäin. Tällöin tutkija lähestyy kohdetta omine käsitteistöineen 
ja pyrkii (usein määrälliseen) esitykseen jonkin havaittavan ilmiön luon- 
teesta. Laadullisessa ihmistieteellisessä tutkimuksessa voidaan vuoros- 
taan pyrkiä löytämään kokonaan uusia merkityksellisiä ilmiöitä: voidaan 
esimerkiksi avoimien kysymysten avulla kysyä tietyltä ryhmältä heidän 
omia käsityksiään jostakin asiasta. Yllä olevassa jaossa on huomattavissa 
näkökulma ihmiseen. Kun ihmistä havainnoidaan ulkoapäin, hänellä ei 
ole valtaa vaikuttaa tutkimuskäsitteistöön. Kun ihmistä sitä vastoin haas- 
tatellaan ja kuunnellaan, hänen äänensä kuuluu. Kielentutkimuksessa 
tällaista jakoa voi problematisoida: Mitä tarkoittaa, että puhujan ääni 
kuuluu tai että kieltä objektivoidaan? Mitä päämääriä jako laadulliseen 
ja määrälliseen palvelee kielentutkimuksessa? 

Kielentutkimuksessa laadullisessakin tutkimuksessa sovelletaan 
käsitteitä, luokituksia ja malleja. Vastaavasti määrällisessä tutkimuk- 
sessa, esimerkiksi suuria korpuksia tutkittaessa, on mahdollista, että 
löytyy uusia ilmiöitä. Keskustelu laadullisesta ja määrällisestä tutki- 
muksesta onkin hyvä ymmärtää karkeaksi yleistykseksi, joka edesauttaa 
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tietynlaisten erojen ymmärtämistä eri metodityyppien välillä. Jakoa ei 
tule ymmärtää kategorisena tai siten, että metodityyppien välille edes 
olisi tarvetta tehdä jonkinlainen tiukka raja. Metodit on hyvä mieltää 
erilaisina prototyyppisinä kategorioina, joiden kriteerit osa laadullisista 
tai määrällisistä metodeista täyttää paremmin ja osa heikommin. Jotkin 
kielentutkimuksessa käytetyt metodit ehkä jopa häilyvät määrällisen ja 
laadullisen tutkimuksen välillä. Vaikka yleensä on niin, että laadullinen 
tutkimus kuvaa, analysoi, määrittelee ja luokittelee ilmiötä ja määrälli- 
nen tutkimus vuorostaan selvittää yleisyyttä ja yleistettävyyteen liittyviä 
kysymyksiä, kielentutkimuksessa on kuitenkin myös uusia tutkimus- 
aloja tai metodeja, jotka eivät sovi tähän jakoon kovin hyvin. Esimerkiksi 
typologiassa tutkitaan usein ilmiöiden yleisyyttä ja aineistona ovat usein 
kielioppikuvaukset, eli tutkimuksen päämäärä on yhteneväinen määräl- 
lisen ja aineisto laadullisen tutkimuksen kanssa. 

Kielitieteen metodologiassa esiintyy myös toisenlaisia eroja suhteessa 
ihmistieteiden metodologian standardikäsitteistöön. Tutkimustyyppiä, 
jota humanistisilla aloilla usein kutsutaan fenomenologiseksi, on kielen- 
tutkimuksessa perinteisesti käsitteellistetty intuitiona tai introspektiona (ks. 
Kielitaju kielentutkijan työkaluna tk.). Kun tutkija nojaa omiin kokemuk- 
siinsa, tietoonsa tai ajatuksiinsa ilmiöstä, esimerkiksi estetiikan tajuun tai 
kielitajuun, perspektiivi on subjektiivinen. Tällöin metodin tieteellisyys 


perustuu tutkijan käsitteelliseen kykyyn eritellä omia intuitioitaan sellai- 
sella tavalla, että ne ovat tutkijayhteisölle ymmärrettäviä, jossakin taus- 
tateoriassa käsitteellistettyjä ja tuovat lisätietoa aiheesta suhteuttamalla 
niitä aikaisempaan tietoon. Pelkkä vapaa tajunnanvirta ilman intuitioiden 
suhteuttamista teoreettiseen keskusteluun ei millään alalla ole tiedettä. 
Metodit voidaan siten jakaa sisäisen ja ulkoisen näkökulman, määräl- 
lisen ja laadullisen lähestymistavan sekä subjektiivisuuden ja objektiivi- 
suuden asteen mukaan. Nuoren ja kehittyvän tieteenalan koulukunta- 
kiistat johtuvat usein siitä, että jonkin näkökulman kannattajat uskovat, 
että yksi näkökulma on ylitse muiden tai että jokin uusi näkökulma 
ilmiöön joko on erityisen perusteltu tai ei ole perusteltu. Kypsä tie- 
teenala pyrkii sen sijaan aktiivisesti kehittämään uusia metodeja, joilla 
voidaan rikastaa käsityksiä ilmiöistä. Se pohtii erilaisten metodologis- 
ten yläjakojen funktiota myös käytännön näkökulmasta. Kuvioon 2 on 
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sijoitettu perinteistä ihmistutkimusta koskevia erilaisia tutkimusase- 
telmia objektivoinnin asteen mukaan sekä laadullisen ja määrällisen 
akselilla. Kuvio 2 on sovellus Konsteniuksen (2014, 167) esittämästä 
kaaviosta, ja siihen on lisätty sinisellä pohjalla kielitieteelle tyypillisiä 
metodeja. 


OBJEKTIVOINNIN ASTE 
A kokeellinen tutkimus 


diskurssianalyysi korrelaatiotutkimus 
korpustutkimus 


metritetyt kyselyt 


strukturoidut kyselyt 


naturalistinen . 
haram strukturoidut haastattelut 


avoimet haastattelut 


kielitaju metodina 


LAADULLINEN MÄÄRÄLLINEN 


» 


Kuvio 2. Laadullinen ja määrällinen tutkimus Konsteniusta (2014, 167) mukaillen. 


Kielitieteessä yksi olennainen aineistonhankintamenetelmä on kielen- 
käytön tarkkailu eli naturalistinen havainnointi. Harjaantunut kielen- 
tutkija tulee huomanneeksi uusia ilmiöitä tai mielenkiintoisia piirteitä 
tutuissa ilmiöissä (esim. Karlsson 1998, 286-287). Esimerkiksi muuta- 
ma vuosi sitten englannin kautta levisi suomeenkin totutusta poikkea- 
va konjunktion käyttö: vierailun aikana en ehdi sanoa yhtäkään lausetta 
loppuun, koska lapset ja väsymys ja kamala häslinki. Konjunktiot aloitta- 
vat tavallisesti sivulauseen, mutta koska x -rakenteessa on usein vain 
substantiivilausekkeita. (Ilmiöstä ks. Sinnemaa 2015.) Myös erilaiset 
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lapsukset ja muut erikoisuudet kiinnittävät huomiota; niissä voi piil- 
lä vakiintumassa olevaa variaatiota ja jopa kielen muutoksen ituja. 
Esimerkiksi suomen potentiaali voi harvinaisuuttaan monelle äidin- 
kielisellekin tuottaa vaikeuksia (tulenee pro tullee, menenee pro mennee 
jne.). Kielentutkimuksessa naturalistinen havainnointi voidaan joiltain 
osin tulkita laadulliseksi tutkimukseksi, sillä se harvoin on strukturoi- 
tua, objektivoivaa tai kovin teoriapitoista. Se on pikemminkin spontaa- 
nia kielentutkijan omaan kielitajuun ja tietoon perustuvaa huomiointia 
luonnollisissa kielenkäytön tilanteissa. Havainnointi on metodina kui- 
tenkin sikäli satunnainen, että ilmiöitä putkahtaa havaittaviksi enna- 
koimattomasti. Se on metodina kielitieteessä korvaamaton mutta vaatii 
tuekseen muita strukturoidumpia menetelmiä, jotta ilmiön yleisyydestä, 
laadusta ja ominaispiirteistä voisi saada tieteellisesti yleistettävää tietoa. 
Tutkimuskohdetta voidaankin lähestyä myös monimenetelmäisesti. 
Monimenetelmäisiä tutkimusstrategioita on yleisesti ottaen kaksi: 
triangulaatio ja sarja-asetelma. Triangulaatio on monimenetelmäinen 
tutkimusstrategia, jossa saman tutkimuskohteen ja -kysymyksen tarkaste- 
lussa käytetään useita erilaisia tutkimusmenetelmiä. Triangulaation taus- 
talla on ajatus, että kohdistamalla useita erilaisia tutkimusmenetelmiä 
samaan tutkimuskohteeseen ja kysymyksenasetteluun tutkimuskohteesta 
voidaan saada luotettavampia tuloksia kuin käyttämällä vain yhtä mene- 
telmää, jos eri menetelmillä saavutetut tulokset ovat samansuuntaisia. 
Toisessa monimenetelmäisessä tutkimusstrategiassa, sarja- 
asetelmassa, ensimmäisestä tutkimuskysymyksestä (k1) seuraa uusi 
tarkentava tutkimuskysymys (k2), johon seuraava tutkimus vastaa. 
Yleistäen voidaan sanoa, että siinä missä triangulaation avulla yhdestä 
ja samasta tutkimuskohteesta pyritään yleensä hankkimaan luotettavam- 
paa kokonaisvaltaista tietoa, sarja-asetelman avulla tutkimuskohteesta 
pyritään hankkimaan monipuolisempaa tietoa kuin pelkästään yhtä tut- 
kimusmenetelmää käyttäen olisi mahdollista saada. Sarja-asetelmassa 
yhdistetään usein laadullisia ja määrällisiä menetelmiä. Esimerkiksi 
aikaisemmassa laadullisessa tutkimuksessa havaitun ilmiön yleisyyttä 
voidaan pyrkiä selvittämään myöhemmässä määrällisessä tutkimuk- 
sessa, tai aikaisemmassa määrällisessä tutkimuksessa havaittuja kiin- 
nostavia tai poikkeavia ilmiöitä voidaan tarkastella lähemmin ja selittää 
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myöhemmän laadullisen tutkimuksen avulla. Vaikka monimenetelmii- 
sessä tutkimusstrategiassa yhdistäminen koskee usein määrällisten ja 
laadullisten menetelmien soveltamista samassa tutkimuksessa, on kui- 
tenkin mahdollista yhdistellä myös esimerkiksi yksinomaan erilaisia 
laadullisia menetelmiä (ks. Creswell 2014; Konstenius 2014, 175-177). 

Kielentutkimuksessa laadullisia ja määrällisiä menetelmiä yhdistelevä 
tutkimusstrategia (joskus jopa samassa tutkimuksessa) on osoittautu- 
nut hyvin hedelmälliseksi. Koska laadulliset ja määrälliset tutkimus- 
asetelmat vastaavat erilaisiin tutkimuskysymyksiin, niitä yhdistelemällä 
tutkittavia ilmiöitä on mahdollista tarkastella eri näkökulmista. Näin 
tutkimuskohteesta saadaan monipuolista tietoa, mikä tekee oikeutta 
ihmiskielen monimuotoiselle olemukselle. Monimenetelmäisyyden hyö- 
tyjä kielentutkimuksessa ovat käsitelleet esimerkiksi Arppe ja Järvikivi 
(2007a; 2007b), Gries ja Divjak (2010) sekä Luodonpää-Manni, Penttilä 
ja Viimaranta (2017). Nykyisin tieteissä ja tiedepolitiikassa suositaan 
aloja ylittäviä monitieteisiä lähestymistapoja. Tämä näkyy suomalai- 
sessa tiedepolitiikassa muun muassa Suomen Akatemian rahoittami- 
na huippuyksikköinä, joilta tyypillisesti edellytetään monitieteisyyttä 
tai tieteidenvälisyyttä. Monitieteisessä tutkimuksessa samaa kohdetta 
tutkitaan useiden eri tieteiden omilla menetelmillä, kun taas tieteiden- 
välisessä tutkimuksessa yhdistetään eri tieteiden lähestymistavat ja luo- 
daan uusi tapa lähestyä tutkimuskohdetta. 


Aiheesta lisää: 
Creswell, John W. 2014. Research Design. Oualitative, Ouantitative and 
Mixed Methods Approaches. Los Angeles (CA): Sage. 


1.4. Tutkimuksen aineistot ja eettiset kysymykset 


Kuten edellisestä luvusta käy ilmi, aineiston laatu ja tarvittava koko ovat 
suoraan riippuvaisia valitusta tutkimusstrategiasta. Olipa valittu lähes- 
tymistapa laadullinen, määrällinen tai monimenetelmäinen, kielen- 
tutkijoiden saatavilla on merkittävä määrä erilaisia ja erikielisiä valmiita 
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aineistoja ja aineistolähteitä, joita voidaan soveltaa tutkimuksen tarpei- 
siin (ks. Korpusaineistot tk.). Valmiiden aineistojen hyödyntäminen 
on järkevää etenkin opinnäytetöitä suunniteltaessa, sillä se nopeuttaa 


tutkimusprosessia. Lisäksi valmiiden aineistojen kohdalla monet ai- 
neiston keräämiseen liittyvät kysymykset, kuten aineiston edustavuus 
ja luotettavuus sekä erilaiset laki- ja sopimusasiat, on jo ratkaistu. Kieli- 
aineistoja ja niiden käsittelyyn sopivia työkaluja on saatavilla esimerkik- 
si kansallisessa FIN-CLARIN-konsortion tarjoamassa Kielipankissa? ja 
eurooppalaisessa CLARIN ERIC -tutkimusinfrastruktuurissa?. Tutkija 
on kuitenkin vapaa keräämään oman aineistonsa, jos oman tutkimuk- 
sen tarpeisiin soveltuvaa aineistoa ei ole valmiina tarjolla tai se on esi- 
merkiksi joiltain osin riittämätöntä. 

Kielentutkimuksessa käytettäviä aineistoja voidaan kerätä lukuisilla 
eri menetelmillä, joista monia esitellään tarkemmin tämän kokoelman 
artikkeleissa (mm. naturalistinen ja strukturoitunut havainnointi, ko- 
keelliset tutkimusasetelmat, vuorovaikutustilanteiden tallentaminen, eli- 
sitaatio ja erilaisten tekstiaineistojen kokoaminen). Aineistoja voi kerätä 
tutkimustarkoituksiin suhteellisen vapaasti mistä tahansa julkaistuista 
teksteistä tai julkisista puheista. Sen sijaan yksityisten julkaisemattomien 
tekstien, esimerkiksi kirjoitelmien, kyselyvastausten, keskustelujen ja 
haastattelujen, keräämiseen tarvitaan tutkittavien suostumus. Suostu- 
musta pyydettäessä on tärkeää kertoa tutkittaville helposti ymmärrettä- 
vällä tavalla, mistä tutkimuksessa on kysymys, sekä määritellä tarkasti, 
millaiseen tarkoitukseen aineistoa käytetään. Yleensä suostumusta ei 
kannata rajata vain yksittäiseen tutkimukseen, vaan se kannattaa pyytää 
esimerkiksi tieteelliseen tarkoitukseen tai tutkimus- ja opetuskäyttöön, 
jotta aineiston jälkikäteinen käyttö helpottuu ja on joustavaa. Suostumus- 
pyynnön yhteydessä tutkittavia informoidaan myös heidän oikeuksistaan. 

Aineiston keräämisessä on lisäksi noudatettava voimassa olevia 
tietosuojasäännöksiät. Nyrkkisääntönä voidaan pitää sitä, että henkilö- 
tietoja kannattaa kerätä ja käsitellä mahdollisimman vähän. Henkilö- 
tiedoilla tarkoitetaan tässä esimerkiksi etu- ja sukunimiä, sáhkóposti- ja 
ip-osoitteita sekä muita henkilöön viittaavia tietoja, joiden perusteella 
yksityishenkilö on mahdollista tunnistaa (tapauskohtaisesti esim. käyt- 
täjätunnukset, paikkakunnat, ammatit). Jos henkilötietojen käsittely ei 
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ole välttämätöntä tutkimuksen tulosten kannalta, aineisto on suositelta- 
vaa kerätä nimettömänä. Tarvittaessa henkilötietoja voidaan kuitenkin 
kerätä tieteellistä tutkimusta varten tietosuojasäännösten puitteissa. 
EU:n tietosuoja-asetus (GDPR, General Data Protection Regulation) 
ja sitä täydentävä, vuoden 2019 alusta voimaan tullut tietosuojalaki 
noudattavat riskiperusteista lähestymistapaa, jossa tietosuojan edel- 
lyttämät menettelytavat mitoitetaan suhteessa arvioituun riskiin, joka 
yksityishenkilölle voi koitua henkilötietojen paljastumisesta. Henkilö- 
tietoja käsittelevän tutkijan tuleekin suunnitella henkilötietojen suojaus- 
toimenpiteet koko käsittelyn elinkaareksi. Ne tulee pystyä myös osoitta- 
maan tietosuojaviranomaiselle (henkilörekisterin tietosuojaperiaatteiden 
osoitusvelvollisuus). Lisäksi tietosuojarikkomuksesta, esimerkiksi hen- 
kilötietoja sisältävän muistitikun katoamisesta, on tehtävä ilmoitus 
tietosuojaviranomaiselle. Voimassa olevista tietosuojasäännöksistä saa 
lisätietoa Tietosuojavaltuutetun toimiston’ lisäksi myös yliopistojen jär- 
jestämistä tietosuojakoulutuksista. Tekijänoikeudesta lisätietoa tarjoavat 
esimerkiksi Kopiosto* ja Sanasto”. 

Laki- ja sopimusasioiden ohella aineiston keräämisen periaatteita oh- 
jaavat myös monet tiedepoliittiset linjaukset, jotka suosivat ns. avoimen 
tieteen periaatteita. Avoimien julkaisujen lisäksi painotetaan yhä enem- 
män myös tutkimusaineistojen avaamista, minkä toivotaan tehostavan 
aineistojen jatkokäyttöä ja parantavan tutkimuksen läpinäkyvyyttä. Sa- 
malla julkaistuista tutkimusaineistoista on tullut varteenotettavia julkai- 
suja varsinaisten tutkimusjulkaisujen rinnalla. Kieliaineistoja voi avata 
esimerkiksi FIN-CLARINin kautta. Se huolehtii aineistojen pitkäaikais- 
tallennuksesta ja tarjoaa tutkijoille apua aineiston luovutukseen liitty- 
vissä kysymyksissä. 

Tutkimusaineiston avaaminen edellyttää huolellista suunnittelua jo 
aineiston keräämisvaiheessa. Jotta aineisto olisi käyttökelpoinen, sii- 
hen tulee liittää erilaisia aineiston alkuperää ja sen keräämistä koskevia 


metatietoja (ks. Korpusaineistot tk.). Tällaisia tietoja ovat esimerkiksi 
tekstin lähde, kirjoittaja tai puhujat, tekstin laajuus ja tekstilaji sekä 
tekstin tuottamisen ajankohta. Lisäksi aineiston metatietoihin on syytä 
kirjata myös tiedot siitä, kuinka raaka-aineistoa on käsitelty, koodattu ja 
rakenteistettu, jotta se on saatu muutettua ja analysoitua varsinaiseksi 
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tutkimusaineistoksi. Raaka-aineistolla tai raakadatalla tarkoitetaan tässä 
siis sisältöä, jota ei ole koodattu tai luokiteltu määrällisesti tai laadul- 
lisesti tulkintaa varten. Tutkimusaineistolla tai tutkimusdatalla puoles- 
taan tarkoitetaan analogisia ja digitaalisia resursseja, jotka on koodattu 
ja luokiteltu päätelmien tekemistä varten. Datasta puhutaan erityisesti 
digitaalisessa muodossa olevien aineistojen yhteydessä. Eron tekeminen 
raaka-aineiston ja tutkimusaineiston välille on tärkeää, jotta tutkijan roo- 
li aineiston luokittelussa ja kuvaamisessa tulee paremmin näkyville. Tut- 
kimustuloksia ei johdeta suoraan raaka-aineistosta, vaan usein tarvitaan 
erityisiä aineiston kategorisoimisen ja kuvaamisen tekniikoita (ks. Joh- 
dannon luku 1.5. tk.), jotta aineistosta voidaan tehdä päätelmiä. Kielen- 


tutkimuksessa tällaisia voivat olla vaikkapa fonemisointi, kieliopillisten 
kategorioiden tunnistaminen tai sana- ja lausesemanttinen analyysi, siis 
kielentutkimuksen tavanomainen analyysitoiminta. On hyvä huomata, 
että käytettävät tekniikat sisältävät teoreettisia valintoja, jotka vaikuttavat 
aineiston tulkintaan. Esimerkiksi suullisten aineistojen litteroinnissa 
valittu menetelmä vaikuttaa siihen, millä tarkkuudella aineistoa kuva- 
taan, käytetäänkö foneettista transkriptiota vai ei, missä määrin ilmeitä 
ja eleitä otetaan huomioon ja kirjataanko tutkimusaineistoon myös ym- 
päristön tapahtumia (ks. esim. Ochs 1979). 

Koska aineistonhallintaan sisältyy monia ratkaistavia kysymyksiä, 
aineiston keräämiseen, käyttöön, säilytykseen ja jatkokäyttöön liittyvät 
periaatteet on hyvä avata erillisessä aineistonhallintasuunnitelmassa. 
Suunnitelma auttaa tutkijaa aineistoon liittyvässä tiedonhallinnassa, ja 
sitä edellytetään yhä useammin myös tutkimusrahoitusta haettaessa. 
Esimerkiksi Suomen Akatemia edellyttää hakijoilta aineistonhallinta- 
suunnitelmaa, jossa eritellään, minkä tyyppisiä tutkimusaineistoja hank- 
keessa kerätään tai käytetään, miten tutkimusaineisto dokumentoidaan, 
miten aineisto tallennetaan, miten taataan sen tietoturva ja yksilönsuoja, 
miten aineiston omistus- ja käyttöoikeuksia hallinnoidaan sekä miten 
aineiston jatkokäyttö mahdollistetaan.? Aineistonhallintasuunnitelma 
ei kuitenkaan ole ainoastaan tutkimuksen alkuvaiheen suunnitteluun 
liittyvä apuväline, vaan se tulee pitää ajan tasalla tutkimuksen edistyessä. 
Aineistonhallintasuunnitelmien tekemiseen on tarjolla tutkijan työtä 
helpottavia työkaluja, kuten DMPTuuli.'* Kuten kaikissa tutkimuksen 
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vaiheissa tutkijan tulee noudattaa myös aineiston keräämisessä tutki- 
muksen eettisiä periaatteita." Johdatuksen tutkimusetiikkaan tarjoaa 
esimerkiksi Kuula (2006). 


Aiheesta lisää: 


Avoin tiede: https://www.avointiede.fi/. 


Kuula, Arja. 2006. Tutkimusetiikka. Aineistojen hankinta, käyttö ja säilytys. 
Tampere: Vastapaino. 


Tietoarkiston aineistonhallinnan käsikirja: http://www.fsd.uta.fi/aineis- 
tonhallinta/fi/. 


Tietosuojavaltuutetun toimisto: https://www.tietosuoja.fi/. 


1.5. Analyysi ja tulosten esittely 


Analyysin tavoitteena on tavallisesti esittää vastauksia tutkijan esittämiin 
tutkimuskysymyksiin. Tutkimuskysymykset sisältävät usein sellaisia 
teoreettisia käsitteitä, jotka tulee operationalisoida eli saattaa sellaiseen 
muotoon, että niitä on mahdollista mitata tai havainnoida mahdollisim- 
man tarkasti. Esimerkiksi lausuman pituus voidaan operationalisoida 
erilaisten teoreettisesti määriteltyjen yksiköiden kautta, kuten laskemal- 
la foneemien, morfeemien, tavujen tai sanojen määriä (Stefanowitsch 
2010, 359-360). Samalla tavalla esimerkiksi kielellinen merkitys voidaan 
operationalisoida hyvin eri tavoin, muun muassa psykolingvistisissä 
koeasetelmissa mittaamalla kognitiivista prosessointia vaikkapa silmän- 
liiketutkimuksella tai reaktioaikatesteillä (ks. Psyko- ja neurolingvistiikka 
tk.), kollokaatiotutkimuksissa tutkimalla sanan suhdetta ympäröivään 


kielelliseen kontekstiin (ks. Määrällinen korpuslingvistiikka tk.) tai tar- 
kastelemalla sanan viittaussuhdetta ulkoisen maailman tarkoitteeseen 
(esim. millaisia ominaisuuksia vaatekappaleella tulee olla, jotta sitä voi- 
daan nimittää leggingseiksi) (Geeraerts, Grondelaers & Bakema 1994). 
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Tutkimuskysymysten selvittämisen apuna käytetään usein ilmiötä 
koskevia oletuksia eli hypoteeseja, joita on erilaisia. Tutkimus- tai selitys- 
hypoteesi on tieteellistä argumentaatiota noudattava selitysmalli, jolla ei 
ole vielä näyttöä tukenaan. Tutkija voi itse koetella hypoteesia, tai hän voi 
tarjota sitä muulle tiedeyhteisölle arvioitavaksi ja koeteltavaksi. Hypotee- 
si voi saada vahvistavaa näyttöä tuekseen, tai hypoteesia koetteleva tutki- 
mus voi sen kumota. Tästä syystä tutkimushypoteesi on syytä muotoilla 
siten, että sen testaaminen on ylipäänsä mahdollista. Tutkimushypoteesit 
perustuvat tavallisesti ilmiöstä aikaisemmin tehtyihin havaintoihin tai 
tutkimuksiin, mutta ne voivat olla myös luovia arvauksia. Testattava 
tutkimushypoteesi olisi esimerkiksi kielenkäyttöä koskeva väite, että tie- 
tynlainen, negatiivissävyinen naisten miehille kohdistama puhe nime- 
tään helpommin nalkuttamiseksi kuin vastaavantyyppinen puhe miehiltä 
naisille (ks. Vanhatalo 2005). Hypoteesia voisi testata korpusaineistolla 
tai kyselyllä. Testaamista varten tutkimushypoteesi muokattaisiin ope- 
rationaaliseen muotoon. Kummassakin tutkimustyypissä tutkijan olisi 
pohdittava, millä lailla puheen suunta sukupuolelta toiselle ja sukupuoli 
itse operationalisoitaisiin tutkimusasetelmassa. Korpustutkimuksessa 
luonnollisen kielen luonnehdinta ”puhe nimetään helpommin” kään- 
nettäisiin määrällisesti mitattavaksi. Kyselytutkimuksessa samaa väitettä 
selvitettäisiin henkilöiden intuitioiden voimakkuudella ja mitattaisiin 
kyselyn vastausvaihtoehtojen skaalojen avulla. 

Operationalisoinnin ja hypoteesin välillä on tärkeä ero. Yleisenä peri- 
aatteena on, että tulisi välttää perustamasta metodia tai tutkimusmallia 
väitteille, joilla on pelkkä hypoteesin asema eikä ollenkaan todistus- 
aineistoa tukenaan. Nykytietämyksen ja -teknologian valossa vaikeasti 
testattava on esimerkiksi kognitiivisessa kieliopissa esitetty väite, että 
kielenkäyttäjät prosessoivat aivoissaan finiittiverbit ja ei-finiittiset verbit 
eri tavalla. Karkeistaen edelliset hahmotettaisiin elokuvamaisesti, jäl- 
kimmäiset valokuvamaisesti. (Ks. Langacker 1987, luku 7.) Tällä hetkel- 
lä meillä ei ole keinoja tutkia, simuloivatko ihmiset eri verbimuodoilla 
kuvattuja tilanteita valokuvien tai elokuvien kaltaisin kognitiivisin pro- 
sessein mielessään. Kyseessä on kuitenkin empiirinen väite, mikä tar- 
koittaa, että sitä periaatteessa voisi testata. Jos meillä olisi (tai joskus tu- 
levaisuudessa on) käytössä ihmisten mielikuvia havainnoiva teknologia, 
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voisimme ratkaista empiirisen evidenssin valossa, pitääkö Langackerin 
(mp.) esittämä teoreettinen väite paikkansa. 

Universaalisten eksistenssilauseiden testattavuudesta on käyty 
tieteenfilosofiassa paljon keskustelua. Nämä lauseet ovat muotoa ”kaikki 
joutsenet ovat valkoisia” tai ”puhe-elimillä tuotetun ihmiskielen keskei- 
set piirteet, kuten lineaarisuus ja kaksoisjäsennys, ovat minkä tahansa 
kielen universaaleja piirteitä”. Emme voi tutkia kaikkia menneitä ja tu- 
levia joutsenia tai tietää, onko ollut olemassa tai tuleeko olemaan muita 
kuin valkoisia joutsenia (on esimerkiksi käynyt ilmi, että Australiassa on 
musta laji, Cygnus atratus). Emme myöskään voi tietää, onko havaitta- 
vassa maailmankaikkeudessa ollut olemassa tai tuleeko olemaan jokin 
oliolaji, jonka kieleksi luokiteltava vuorovaikutusjärjestelmä poikkeaa 
tyystin ihmiskielestä. Tällaisilla universaaleilla lauseilla ei tieteessä voi 
loogisesti olla evidenssiä oikeutuksenaan, ja ne tulee siksi tutkimuk- 
sessa muotoilla rajatuiksi eksistenssilauseiksi, esimerkiksi ”Euroopan 
mantereen joutsenilla on geneettinen perimä, joka tuottaa valkoisia 
fenotyyppejä” tai ”puhe-elimillä tuotetun kielen keskeiset piirteet, kuten 
lineaarisuus ja kaksoisjäsennys, ovat ihmiskielille tyypillisiä”. Rajattuja 
eksistenssilauseita voidaan yleensä testata. Yksittäistä tutkimusta varten 
väitteen rajausta supistetaan edelleen tutkimuksen empiiristä aineistoa 
vastaavaksi. Jos aineistona on esimerkiksi Kauhavalla puhuttava etelä- 
pohjalainen nykymurre, tämä toimii tutkimuksen eksistenssiväitteiden 
rajauksena. 

Tutkimushypoteesi ei ole sama asia kuin tutkijan yksityinen havain- 
to tai tutkijan ennakko-oletus tutkimuksen kohteen luonteesta. Jälkim- 
mäinen on kaikilla eri alojen tutkijoilla välttämättä oltava: tutkija tar- 
vitsee ainakin jonkinlaisen ennakko-oletuksen siitä, millaista ilmiötä 
hän tutkii, jotta hän voi ylipäätään rakentaa tutkimusasetelman kokeil- 
lakseen ideoitaan. Tällaista ennakko-oletusta kutsutaan työhypoteesik- 
si. Tutkimushypoteesista poiketen työhypoteesia ei ensisijaisesti pyritä 
testaamaan tutkimuksen kuluessa, vaan se hyväksytään alustavasti tut- 
kimusta ohjaavaksi periaatteeksi. Työhypoteesi koostuu teoreettisista en- 
nakko-olettamuksista, jotka mahdollistavat sen, että tutkija voi muodostaa 
alustavan käsityksen tutkittavasta ilmiöstä. Jo aineiston kerääminen vaa- 
tii usein ainakin jonkinlaisen ennakko-oletuksen tutkittavasta ilmiöstä. 
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Tutkijan ei kuitenkaan tarvitse kiinnittyä tutkimuksen alussa muotoile- 
maansa työhypoteesiin, vaan sitä voidaan korjata tutkimuksen kuluessa, 
mikäli ennakko-olettamukset osoittautuvat epätarkoiksi tai vääriksi. 
Tutkimus- tai selityshypoteesin ja työhypoteesin eroa voi havain- 
nollistaa seuraavalla esimerkillä. Kielentutkijalla on kielenkäytön 
tarkkailun kautta saatu havainto Y (tietyissä suomen morfeemeissa ei 
odotuksenvastaisesti toteudukaan rajageminaatio, esim. hernekeitto lau- 
sutaan [hernekeitto], ei [hernek:eitto]) jostakin kielen yleisestä ilmiöstä 
Z (suomen tiettyjä morfologisia muotoja koskeva rajageminaatio- tai 
loppukahdennusilmiö). Kielentutkija muotoilee työhypoteesin T (mitkä 
tekijät vaikuttavat siihen, että rajageminaatio on vähenemässä tai hä- 
viämässä tietyistä muodoista). Tämän perusteella hän ideoi sellaisen 
aineisto-otannan A (rajageminaatiomuotoja sisältävää puhetta Suomen 
kattavalla murreotannalla), jonka hän uskoo vakuuttavan muun tiede- 
yhteisön kielenilmiön olemassaolosta. Hänellä voi myös olla selitys- 
hypoteesi S (miksi tietyistä muodoista rajageminaatio on vähentynyt tai 


Kielentutkija tarkkailee kielenkäyttöä ja tekee 


havainnon Y (rajageminaatio ei toteudu) 
kielenilmiöstä Z (suomen kielen rajageminaatio). 


v 


Kielentutkija muotoilee työhypoteesin T (mitkä 
tekijät oletettavasti vaikuttavat havaittuun ilmiöön), 
jonka perusteella hän ideoi aineisto-otannan A 
(murreaineisto) kielenilmiön tarkastelemiseksi. 


v 


Kielentutkijalla voi olla myös selityshypoteesi S 
(miksi rajageminaatio on katoamassa ainakin 


tietyistä muodoista), jota hän koettelee tieteellisen 
menetelmän avulla. 


Kuvio 3. Esimerkki työhypoteesin ja selitys- 
hypoteesin tehtävistä kielentutkimuksessa. 
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häviämässä), joka kertoo, miksi ilmiö Z toimii juuri niin kuin toimii. 
Onnistuneimmillaan tutkija osaa rakentaa työhypoteesinsa perusteella 
sellaisen tutkimusasetelman, jossa kaikki havainnot Y (1...n) ilmiöstä Z 
aineistossa A on selitettävissä S:n avulla. Työhypoteesi on siis sellainen 
odotuksista koostuva väite (valistunut arvaus), joka ohjaa tutkimuksen 
kulkua ja jonka tutkimustulokset voivat osittain vahvistaa tai kieltää. 

Tutkimustulosten valmistuttua tutkijan tulee vielä arvioida kriittises- 
ti niiden luotettavuutta. Luotettavuuden arvioinnissa esimerkiksi ope- 
rationalisoinnilla sekä erilaisilla metodien uskottavuutta (robustisuus, 
tarkkuus, poikkeavien havaintojen merkitys) arvioivilla menetelmillä 
on keskeinen merkitys. Voihan olla, että tulokset olisivat paremmin se- 
litettävissä jollain toisella hypoteesilla tai että hypoteesin testaamisessa 
käytetty tieteellinen menetelmä ei soveltunutkaan tarkoitukseen par- 
haiten. Virhepäätelmien poissulkemiseksi tilastollisessa testaamisessa 
käytetään yleensä ns. nollahypoteesiasetelmaa. Tällöin tutkimuksessa 
asetetaan tutkimushypoteesin lisäksi sille vastakkainen nollahypoteesi 
ilmaisemaan sellaista odotettavissa olevaa tulosta, jossa kahden ilmiön 
välillä ei ole yhteyttä. Lääketieteessä nollahypoteeseja käytetään osoitta- 
maan, että jokin hoito on tehoton. Kielentutkimuksessa nollahypotee- 
seja voidaan käyttää tasapainottamaan päätelmän oikeutusta. Jos aineis- 
tossa ei ole riittävästi näyttöä nollahypoteesin hylkäämiselle, riski tehdä 
väärä päätelmä on yleensä suuri. Nollahypoteesia käytetään siis kilpai- 
levana hypoteesina. Jos sitä ei voida perustellusti hylätä, ei voida olla 
varmoja, että tutkimushypoteesin muotoilemien ilmiöiden välillä todella 
olisi syy-yhteys tai muu kytkös. On tärkeää huomata, että nollahypoteesi 
ilmaisee jonkin ilmiön poissaoloa, eikä sitä siten voi koskaan loogisesti 
todentaa eli verifioida. Nollahypoteesi voidaan ainoastaan kumota eli 
falsifioida tai jättää kumoamatta. (ks. Johdannon luku 2.5. tk.) 

Tutkija voi nojata tutkimuksessaan erilaisiin päättelytapoihin: induk- 


tiiviseen, deduktiiviseen tai abduktiiviseen päättelyyn. Induktiivinen 
päättely lähtee liikkeelle käytännöstä ja etenee aineistossa esiintyvien 
yksittäistapausten tarkastelusta kohti havaintojen perusteella tehtyjä 
yleisempiä päätelmiä. Induktiivinen päättely soveltuu esimerkiksi ai- 
kaisemmin vain vähän tutkittujen alueiden eksploratoriseen tutkimuk- 
seen. Tällöin tutkimushypoteeseja ei välttämättä muodosteta, mutta 
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erityisesti laadullisissa tutkimuksissa voidaan hyödyntää alustavasti hy- 
väksyttyjä työhypoteeseja, jotka toimivat tutkimuksen teoreettisena ke- 
hyksenä. Laadulliset tutkimukset perustuvat tyypillisesti induktiiviseen 
päättelyyn, jossa tutkija johtaa yksittäistapauksista yleistyksiä. Havainto 
yksittäistapauksista perustuu aineistoon, joka on ensin luokiteltu jonkin 
taustateorian käsittein ja luokituksin. Rajatusta aineistosta ei yleensä 
voida induktiivisesti johtaa koko populaatiota eli perusjoukkoa koskevia 
päätelmiä. Perusjoukolla viitataan niihin tutkimusyksiköihin, joista tut- 
kimuksella halutaan sanoa jotain. Esimerkiksi yksittäisiä suomen kielen 
puhujia havainnoimalla ei loogisesti voida tehdä kaikkia suomen kielen 
puhujia koskevia päätelmiä. Sen sijaan havaintojen perusteella on mah- 
dollista muodostaa eli generoida hypoteesi, jota voidaan testata toisella 
päättelytavalla, esimerkiksi deduktiivisesti. 

Deduktiivinen päättely etenee induktioon nähden päinvastaisessa 
järjestyksessä, toisin sanoen yleistyksestä yksityistapausta koskevaan 
päätelmään. Deduktiivinen päättely soveltuu esimerkiksi aikaisempia 
teorioita tai hypoteeseja testaavaan konfirmatoriseen tutkimukseen. 
Määrälliset tutkimukset perustuvat tyypillisesti tällaiseen deduktiiviseen 
päättelyyn. On kuitenkin huomattava, että myös määrällinen tutkimus 
voi olla hypoteesia generoivaa ja näin ollen eksploratiivista eli tutkimus- 
aluetta kartoittavaa. Käytännössä voidaan lähteä liikkeelle teoriasta 
tai aikaisemman tutkimuksen tuloksista ja testata näistä johdettujen 
hypoteesien paikkansapitävyyttä yksittäistapauksissa. Jos esimerkiksi 
aikaisemmassa haastattelututkimuksessa huomataan, että monet 
haastateltavista assosioivat kissa-sanaan yllättävällä tavalla feminiini- 
sen sukupuolen, tästä voidaan generoida hypoteesi ”kissaan liitetään 
suomessa feminiininen sukupuoli”. Hypoteesia voidaan sitten testata 
otoksen avulla (ks. Kysely tk.), vaikkapa poimimalla puhelinluettelosta 
joka 2 ooo:s nimi kyselyn pohjaksi. Määrällisessä tutkimusasetelmassa 
osallistujilta kysytään tämän jälkeen tyypillisesti suljettuja kysymyksiä, 
joiden määrää ja laatua mitataan. Tällaista päättelymuotoa kutsutaan 
hypoteettis-deduktiiviseksi, sillä rakenteellisesti tutkimusasetelma pe- 
rustuu kahden lauseen väliseen suhteeseen, hypoteesiin ja tulokseen. 
Tutkimuksen tulos joko kieltää tutkimushypoteesin tai antaa esitetylle 
hypoteesille tukea. 
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Induktion ja deduktion lisäksi tutkijan tekemät päätelmät voivat pe- 
rustua myös abduktiiviseen päättelyyn. Abduktiivinen päättely hyödyn- 
tää sekä taustateoriasta johdettuja hypoteeseja että aineistosta tehtyjä 
havaintoja ja etenee todennäköisimpään selitykseen. Abduktiossa itse 
päättelyprosessi voi edetä kumpaan tahansa suuntaan eli havainnoista 
teoriaan tai teoriasta havaintoihin. Ilmiötä koskevien päätelmien lisäksi 
tutkija voi siis kehittää tutkimustulostensa perusteella myös uusia hypo- 
teeseja ja teorioita, joita voidaan sitten testata tulevissa tutkimuksissa. 

Kuvio 4 kiteyttää edellä kuvatut laadulliseen ja määrälliseen tutki- 


mukseen liitettävät perusominaispiirteet. 


MÄÄRÄLLINEN 

TUTKIMUS 

- hypoteesia testaava 
(myös generoiva) 

- deduktiivinen 

päättely 


LAADULLINEN 
TUTKIMUS 
hypoteesia generoiva 
induktiivinen 
päättely 


hypoteesi ja 


käsitteistö 


Kuvio 4. Laadullinen ja määrällinen tutkimus karkeasti esitettynä moni- 
menetelmäisessä tutkimusasetelmassa (Konstenius 2014, 174). 


Aineiston analysoinnissa käytettävät tarkemmat metodit ovat suoraan 
sidoksissa valittuun tutkimusstrategiaan. Siinä missä määrällisissä tutki- 
muksissa aineistoa analysoidaan usein erilaisia tilastollisia menetelmiä 
hyödyntäen, laadullisissa tutkimuksissa aineistoa voidaan jäsentää esi- 
merkiksi taustateorioihin perustaen. Jokainen tutkimus sisältää tyypil- 
lisesti ainakin jonkinlaisen aineistonkeruumenetelmän, jolla tutkimus- 
aineisto on hankittu, sekä tutkimusmenetelmän (tai -menetelmiä), 
jonka avulla aineistosta on pyritty hankkimaan uutta tietoa. Aineiston 
keräämisen tekniikoita ovat esimerkiksi havainnointi, koeasetelmat, ky- 
selyt, haastattelut ja muu (kieli)aineistojen kerääminen. Aineiston ka- 
tegorisoimisen ja kuvaamisen tekniikoita ovat muun muassa aineiston 
luokittelu, korpusaineistojen annotointi ja suullisten aineistojen litte- 
rointi ja transkribointi. Aineiston analyysin tekniikoita ovat esimerkiksi 
kieliopillisten kategorioiden tunnistaminen, sana- ja lausesemanttinen 
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analyysi, erilaiset tilastolliset ja matemaattiset menetelmät sekä tausta- 
teoriasta kumpuavien käsitteiden hyödyntäminen aineiston jäsennyk- 
sessä. Lisäksi voidaan erottaa erityisiä päätelmien tekemisen tekniikoita 


(ks. Johdannon luku 2.6. tk.). Tutkimuksen eri vaiheisiin liittyvien tek- 
niikoiden erittely voi helpottaa oman tutkimuksen jäsentämistä ja lisä- 
tä näin myös tutkimuksen tarkkuutta. Erittelyn apuna voidaan käyttää 
myös johdannon luvussa 2 esitettyjä metodin ehtoja. 

Sekä laadullisissa että määrällisissä tutkimuksissa aineistoa voi- 
daan esitellä kokoavasti taulukoiden ja kuvioiden avulla tai esimerkin- 
omaisesti lainaamalla näytteitä alkuperäisaineistosta. Aineiston sisällön 
julkaisemisessa on kuitenkin huolehdittava siitä, että yksityishenkilöitä 
ei voida tunnistaa näytteen perusteella. Tämä tarkoittaa sitä, että viimeis- 
tään tässä vaiheessa aineisto on anonymisoitava eli siitä on poistetta- 
va tai muutettava kaikki henkilöön viittaavat ja muut yksilöivät tiedot. 
Tämänkin jälkeen aineistoon voi joissain tapauksissa jäädä sellaista 
arkaluontoista materiaalia, jonka kohdalla tutkija voi joutua pohtimaan, 
missä määrin aineistoa on tarpeen julkistaa. Tutkijan tulee noudattaa 
tutkimustyössä hyvän tieteellisen käytännön periaatteita, kuten rehel- 
lisyyttä, yleistä huolellisuutta ja tarkkuutta (TENK 2012). Tämä koskee 
tutkimuksen koko elinkaarta: tutkimuksen suunnittelua, varsinaista 
tutkimustyötä, tutkimustulosten julkaisemista ja tutkimustulosten ja 
aineistojen jatkokäyttöä. Vastuullinen tiede -sivusto tarjoaa lisätietoa 
tutkimusetiikan ja tiedeviestinnän hyvistä käytänteistä tutkimuksen 
elinkaarimallin jokaisessa vaiheessa.” 


Aiheesta lisää: 


TENK 2012. Hyvä tieteellinen käytäntö ja sen loukkausepäilyjen käsit- 
teleminen Suomessa. Tutkimuseettisen neuvottelukunnan ohje 2012. 


Helsinki: Tutkimuseettinen neuvottelukunta. http://www.tenk.fi/sites/ 
tenk.fi/files/HTK ohje 2012.pdf. 


Vastuullinen tiede. Tutkimusetiikka ja tiedeviestintä Suomessa: https:// 
www.vastuullinentiede.fi/. 
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1.6. Miten kielentutkimuksen menetelmillä voidaan 
vastata ihmiskunnan suuriin haasteisiin? 


Kielellä on keskeinen rooli kaikessa yksilön ja yhteiskunnan psyko- 
sosiaalisessa toiminnassa: sen avulla hahmotetaan maailmaa, vaihde- 
taan ajatuksia ja tehdään yhteiskunnallisia päätöksiä. Koska kielenkäyttö 
ja kielelliset sopimukset ohjaavat ihmisyhteisöjen toimintaa monin ta- 
voin, ihmisyhteisöissä havaitut ongelmat ovat usein sidoksissa kieleen 
ja kommunikaatioon (Tiililä 2017a; 2017b; ks. myös Searle 1995; 2010). 
Kielenkäyttöön liittyviä ongelmia ei kuitenkaan tunnisteta kovin hyvin. 
Ihmiskunnan suurista haasteista puhuttaessa katse käännetään usein 
yhteiskuntatieteilijöihin tai luonnontieteilijöihin, jotka myös hakevat 
kielentutkijoita aktiivisemmin valtion strategista tutkimusrahoitusta, 
vaikka strategisen tutkimuksen painopisteissä on myös kielentutkijoille 
sopivia teemoja. On tärkeä ymmärtää, että koska kieli on keskeinen 
osa kaikkea yhteiskunnallista toimintaa, kielentutkija tutkii yhteis- 
kuntaa suoraan ja hänellä on siten paljon mahdollisuuksia vastata yh- 
teiskunnan ja ihmiskunnan suuriin haasteisiin. Erilaisia listauksia näis- 
tä haasteista ovat tehneet muun muassa Suomen Akatemia, Unescon 
Millenium-hanke" ja YK5. Haasteet ovat luonteeltaan sellaisia, että 
kielentutkimus tai mikään muukaan tieteenala ei yksin pysty ratkaise- 
maan niitä kaikkia, vaan tarvitaan tieteidenvälistä yhteistyötä. Kielen- 
tutkijoilla on kuitenkin käytössään välineitä ja osaamista, jotka voivat 
toimia tärkeänä osana haasteiden ratkaisemisessa.'* 

Kielentutkijoiden ydinosaamista ovat kielenkäyttö, ihmisten välinen 
vuorovaikutus ja kulttuurienvälinen viestintä, joihin monet maailman 
syvimmistä ongelmista tavalla tai toisella liittyvät. Kielentutkijoita tar- 
vitaan tunnistamaan näitä kieleen ja kommunikaatioon liittyviä haas- 
teita. Tällä hetkellä akuutteja ovat esimerkiksi globalisaation, digitali- 
saation ja eriarvoistumisen kysymykset, joihin kaikkiin voidaan löytää 
ratkaisuja tavoitteellisen dialogin avulla. Kielentutkijat voivat edesauttaa 
keskinäistä ymmärrystä ja selvittää, miten esimerkiksi verkkoviestintä 
muuttaa ihmisten välistä kommunikaatiota ja yhteiskuntaa. Yksi hyvä 
sovellusesimerkki tästä on tekoälytutkija Timo Honkelan (2017) rauhan- 
konehanke, jossa keskeisessä roolissa on kielellinen kommunikaatio ja 
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tekoälyn käyttäminen ihmisten keskinäisen ymmärryksen lisäämisessä. 
Radikalisoitumista pyritään ratkomaan viestinnällisin keinoin monis- 
sa hankkeissa (ks. mm. IC Thinking Cambridge; Suomessa Helsingin 
kaupungin hanke ”Minun silmin, sinun silmin””). Kieliteknologian, 
kuten puheenkäsittelyn, puheentunnistuksen ja puhesynteesin, kehitys 
tarjoaakin paljon mahdollisuuksia merkityksellisen vuorovaikutuksen 
lisäämiselle. 

Keskinäinen ymmärrys on keskeistä myös kulttuurien vuoropuhelua 
koskevissa haasteissa. Kun ratkaistaan erilaisia konflikteja ja globaalin 
muuttoliikkeen mukanaan tuomia ongelmatilanteita, erilaisten näkö- 
kulmien ymmärtäminen on keskeisellä sijalla. Kielentutkimuksen kei- 
noin voidaan parantaa edellytyksiä kulttuurien vuoropuhelulle ja hel- 
pottaa esimerkiksi maahanmuuttajien ja muun väestön sopeutumista 
muuttuvaan tilanteeseen pyrkimällä lisäämään ymmärrystä ja suvaitse- 
vaisuutta (ks. Heikkilä & Niiniluoto 2016; Luodonpää-Manni ja muut 
2017). Keskinäinen ymmärrys ja vuorovaikutus ovat myös liberaalin de- 
mokratian kulmakiviä. Kielentutkijat voivat omalla panoksellaan tuoda 
esiin myös kielivähemmistöjä ja uhanalaisia kieliä koskevia kysymyk- 
siä sekä vaikuttaa näiden tukemiseen. Tässä työssä on tärkeää muun 
muassa kielien dokumentointi ja kuvaaminen sekä harvinaisten kielten 
revitalisaatio (ks. Kielten dokumentointi ja kieliopin kuvaus; Antropolo- 


ginen lingvistiikka tk.). 
Yhteiskunnan näkökulmasta kielenkäyttöön liittyvien ongelmien pa- 


rempi tunnistaminen olisi merkittävää esimerkiksi yhteiskunnan eri- 
arvoistumiskehityksen katkaisemiseksi. Koska julkinen valta konkreti- 
soituu pitkälti kielen avulla, teksteillä on keskeinen rooli julkishallinnon 
työssä. On viitteitä siitä, että etäännyttävä ja ulossulkeva virkakieli joh- 
taa julkisten palveluiden alikäyttöön ja on osaltaan vaikuttamassa esi- 
merkiksi nuorten syrjäytymiseen (Tiililä 2017a; 2017b). Tämän vuoksi 
monet puhuvat mieluummin syrjäyttämisestä kuin syrjäytymisestä. 
Syrjäytyminen terminä jättää vastuun yksilölle itselleen, kun taas syrjäyt- 
täminen nostaa esiin yhteiskunnallisten rakenteiden (ja kielenkäytön) 
vaikutuksen tässä prosessissa. Syrjäytyminen ja syrjäyttäminen toimivat 
samalla esimerkkinä siitä, miten kieli on aina näkökulmaista. Kielel- 
linen tuotos ei ole neutraali, vaan tällaisia merkitysneuvotteluja tulisi 
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käydä paljon useammin kuin nykyisessä julkisessa keskustelussa tava- 
taan tehdä. Kielentutkimus tarjoaa tarkat käsitteet ja metodit tällaisten 
kielellisten merkitysneuvotteluiden purkamiseen. 

Kielentutkijoita tarvitaan myös suomen kielen kehittymisen tarpei- 
siin. Tieteen kielen painottuessa yhä enenevässä määrin englantiin 
tarvitsemme suomen kielestä ja sen käytöstä tutkimusta, jota myös 
julkaistaan suomeksi. Jos suomenkielisen terminologian kehittäminen 
laiminlyödään, voi olla, että pian ei ole edes mahdollista käydä tieteel- 
listä keskustelua suomeksi. Tällöin riskinä on suomen sulkeutuminen 
tieteellisen kielenkäytön ja tiedediskurssin ulkopuolelle. Eräs tällaista 
kehitystä torjuva hanke on Tieteen termipankki, jonka tavoitteena on 


koota ja ylläpitää kaikkia tieteenaloja koskevaa avointa termitietokantaa 
tutkijoiden ja kansalaisten käyttöön. Verkkopalvelu” avattiin vuonna 
2012, ja sitä ylläpidetään talkooperiaatteella eri alojen tutkijoiden kans- 
sa. Kielitiede on ollut yksi ensimmäisistä Tieteen termipankin pilotti- 
hankkeeseen osallistuneista tieteenaloista. 

Kielentutkijoilla on annettavaa sellaisiinkin globaaleihin haasteisiin 
kuin ilmastonmuutokseen vastattaessa. Vaikka ilmastonmuutosta si- 
nänsä ei voida suoraan pysäyttää kielentutkimuksen menetelmillä, on 
huomattava, että ratkaisuja ilmastonmuutosta koskeviin ongelmiin 
haetaan kielelliseen kommunikaatioon ja vuorovaikutukseen perustu- 
vien poliittisten neuvotteluiden kautta. Esimerkiksi ilmastosopimusten 
aikaansaaminen vaatii laajaa yhteisymmärrystä ilmastonmuutoksen 
luonteesta, seurauksista ja keinoista, joilla sitä voidaan torjua. Yhteis- 
ymmärryksen puute puolestaan voi vakavasti vaarantaa tai jopa estää 
globaalien ongelmien ratkaisut. Koska kieli ei ainoastaan kuvaa vaan 
myös luo todellisuutta, ilmastonmuutoksen ja muiden globaalien haas- 
teiden olemassaolosta ja sen kiistämisestä käytäviä merkitysneuvotteluja 
voidaan purkaa ja tuoda näkyväksi kielentutkimuksen keinoin. Globaa- 
leihin haasteisiin vastattaessa olennainen edellytys yhteisymmärryksen 
syntymiselle on lisäksi kulttuurienvälinen kommunikaatio, joka on niin 
ikään kielentutkimuksen ominta alaa. 

Koska tutkimusten mukaan humanistien, siis myös kielentut- 
kijoiden, asiantuntemusta arvostetaan yhteiskunnassa (Heikkilä & 
Niiniluoto 2016), tutkijoiden tulisi entistä aktiivisemmin ottaa osaa 
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yhteiskunnalliseen keskusteluun ja saattaa tuloksiaan eri sidosryhmi- 
en saataville. Tuomas Heikkilän ja Ilkka Niiniluodon (2016) tutkimuk- 
sessa kansanedustajien tuntemus humanistisesta tutkimuksesta oli eri 
päättäjäryhmien heikoin, ja kuitenkin juuri he tekevät isoja päätöksiä 
tieteen voimavarojen suuntaamisesta sekä ihmisiin ja yhteiskuntaan 
vaikuttavista poliittisista ratkaisuista. Kirjoittajien mukaan humanistien 
pitäisikin aktiivisemmin tiedottaa omista tutkimuksistaan myös aka- 
teemisen maailman ulkopuolelle. Tutkimuksen sisällön tuntemus lisää 
Heikkilän ja Niiniluodon tulosten mukaan myös sen arvostusta. Samalla 
voidaan antaa työkaluja poliittiseen päätöksentekoon. 

Kieli koetaan usein hyvin henkilökohtaiseksi ja tunteita herättäväksi 
asiaksi, ja jos kielentutkijat eivät ota rooliaan alan asiantuntijoina, kes- 
kustelu jää vähemmän asiantuntevien keskustelijoiden ja usein liian 
tunnevaltaisen argumentoinnin varaan. Relevanttien tutkimustulosten 
tuottaminen ja niiden saattaminen ymmärrettävään muotoon ei kuiten- 
kaan ole yksinkertaista, vaan siihen täytyy erikseen panostaa. Yliopistot 
tarjoavatkin tutkijoille säännöllisesti lisäkoulutusta tiedeviestinnässä. 
Samalla kuitenkin kielentutkijoilla on velvollisuus suhtautua kriittises- 
ti siihen, millaista tiedeviestinnän tulisi olla, sillä sekin on kielellistä 
toimintaa. 

Vaikka kielentutkimuksen menetelmillä on suuria yhteiskunnallisia 
sovellusmahdollisuuksia, samalla on kuitenkin syytä muistaa, että so- 
veltavan tutkimuksen lisäksi kielentutkimuksessa tarvitaan myös sen 
omista lähtökohdista käsin määriteltyä perustutkimusta. Heikkilän ja 
Niiniluodon (2016, 82) mukaan ”[t]iedettä ovat aina vieneet eteenpäin 
suuret peruskysymykset, jotka ovat syntyneet tieteen sisältä, aiemman 
tutkimuksen avaamista ongelmanasetteluista”. Perustutkimus tuottaa 
tieteenalalle tukevan tietoperustan, jonka varaan soveltava tutkimus 
voi sitten rakentaa. Toisaalta soveltava tutkimus voi myös tarjota uusia 
perustutkimuksellisia kysymyksiä. Perus- ja soveltava tutkimus muo- 
dostavatkin jatkumon, jonka kaikkia sävyjä tutkimusyhteisössä ja yhteis- 
kunnassa tarvitaan. 
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VIITTEET 


1 Voidaan ajatella, että kielen perustava kaksoisjäsennys on tunnettava ennen kuin aukeaa 
lingvistisen kuvauksen mahdollisuus kielen ”kolmannelle” jäsennykselle eli semiootti- 
sen (esim. peirceläisen) merkitsemistapahtuman analysoinnille. 

2 https://www.kielipankki.fi. 

3 https://www.clarin.eu/. 

4 EU:n tietosuoja-asetuksen soveltaminen 25. toukokuuta 2018 alkaen on tuonut uusia 

oikeuksia omiin henkilötietoihin. Ks. tarkemmin https://www.tietosuoja.fi. 

https: //www.tietosuoja.fi/. 

https: //www.kopiosto.fi/. 

https: //www.sanasto.fi/. 

https: //www.avointiede.fi/. 

https: //www.aka.fi/tutkimusrahoitus/hae-rahoitusta/nain-haet-rahoitusta/ohjehakemis- 

to/aineistonhallinta/aineistonhallintasuunnitelma/. 

10 https://www.dmptuuli.fi/. 

11 https://www.tenk.fi/. 

12 https://wwwvastuullinentiede.fi. 

13 https://www.aka.fi/strateginen-tutkimus/. 

14 https://www.un.org/sustainabledevelopment/. 


(O ON O wu 


15 http://www.un.org/en/sections/issues-depth/global-issues-overview/. 

16 Kielentutkija Martin Hilpert käsittelee Youtube-videossaan kielentutkimuksen roolia 
liittyen yhteiskunnan suuriin haasteisiin: https://www.youtube.com/watch?v=X40aN- 
39sNAI&feature=youtu.be. 


17 https://misi.hel.fi/. 
18 http://tieteentermipankki.fi/wiki/Termipankki:Etusivu. 
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2. Tieto, tieteellinen tieto ja tieteellinen 
menetelmä 


Reetta Konstenius 


Markus Hamunen 
O https://orcid.org/0000-0003-2786-6392 


Tämän luvun tarkoituksena on selkeyttää tieteellisen metodin ehtoja si- 
ten, että lukijan tiedot ja ymmärrys metodien tieteellisyyden arvioinnista 
ja uusien luovien metodien kehittämisestä kasvavat. Luvussa kartoitetaan 
tieteellisten tutkimusmetodien jaettuja ominaisuuksia, ehtoja ja yleisiä 
periaatteita. Termiä tieteellinen menetelmä tai metodi käytetään niistä kei- 
noista, joiden systemaattisen soveltamisen tuloksena saadaan tieteellistä 
tietoa. Luvussa toisin sanoen selvennetään sitä, mikä erottaa tieteellisen 
tutkimusmetodin muista vaihtoehtoisista tiedonhankintatavoista, tieteen 
näennäistieteestä ja tieteellisen tiedon pelkästä uskomuksesta. Luvun 
tavoite on jäsentää kielentutkimuksen metodologian yleisiä piirteitä si- 
ten, että se edesauttaa erilaisten tiedonhankintatekniikoiden kriittistä 
arviointia, innovatiivista kehittämistä ja yhdistämistä. 

Tämä teos kokonaisuudessaan kuuluu sekä kielentutkimuksen 
metodologian että metodiikan alaan, sillä kirjan tavoitteena on antaa 
laaja-alainen kuva kielentutkimuksessa käytössä olevista tutkimus- 
tekniikoista. Johdannon tämä luku on metodologiaa (ks. myös Johdan- 
non luku 3 tk.), sillä se vastaa kysymykseen, millä yleisillä kriteereillä 
jotakin tiedonhankintakeinoa pidetään tieteellisenä metodina. Metodo- 
logia tarkastelee myös tieteen metodiikkaa, sillä osa metodologisesta tut- 
kimuksesta kohdistuu konkreettisiin, yksittäisiin käytössä oleviin meto- 
deihin. Suuri osa tieteen metodeista kehittyy eri alojen arkitutkimuksen 
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lomassa, ei niinkään ylhäältä alas, teoriasta käytäntöön. Metodologiassa 
tutkitaan sitä, täyttävätkö nämä arkisen tutkimuksen myötä kehitetyt 
tutkimustekniikat tieteellisen metodin kriteerit. Koska metodologia kat- 
taa sekä tutkimusmetodien teorian (normatiivisen aspektin) että niiden 
tutkimuksen (faktuaalisen aspektin), metodologiasta voidaan käyttää 
myös nimitystä tutkimustekniikoiden metateoria. Tämä metanäkökulma 
säilyy koko tämän teoksen kaikissa luvuissa: kielentutkimuksen me- 
todeja kuvataan sekä metodiikan (sovelletut tutkimusmetodit) että 
metodologian (teoreettinen ylätaso) kannalta. 

Tässä luvussa käsitellään tieteellisen metodin ehtoja. Johdannon luvus- 
sa 3 vuorostaan käsitellään laajemmin varsinaisten kielentutkimuksessa 
käytettyjen metodien teoriasidonnaisuutta ja kielentutkimuksen kent- 
tää. Tämän luvun tavoite on auttaa lukijaa ymmärtämään, millaisista 
prosesseista voi käyttää termiä metodi. Luvun 3 tavoite on vuorostaan 
auttaa ymmärtämään metodin ja taustateorian suhdetta. Taustateoria 
kertoo, millaisia ominaisuuksia tutkimuskohteella on ja mitkä ovat ne 
tietoteoreettiset oletukset, jotka ohjaavat tutkimusmetodin tai -tekniikan 
kohdistamista kohteeseen. 


2.1. Tieteellisen menetelmän ehdoista 


Tieteellistä metodia pidetään yleensä sinä kriteerinä, jonka perusteella tie- 
de voidaan erottaa muusta inhimillisestä toiminnasta: tieteellinen metodi 
erottaa tieteen ei-tieteestä. Tieteellinen metodi ja tiede ovat siten käsitteel- 
lisesti toisistaan riippuvaisia. Ne esiintyvät lähes aina toistensa määritel- 
missä ja implikoivat toinen toistaan, joskin eri tieteenfilosofisissa koulu- 
kunnissa eri tavoin. Jotkin koulukunnat painottavat kuitenkin enemmän 
tieteellistä prosessia ja toiset taas prosessin tuloksena saatavaa tietoa. 

Mitä sitten tarkoittaa se, että tieteellinen metodi ja tiede implikoivat 
toisiaan? Implikaatio on looginen suhde etujäsenen ja takajäsenen välil- 
lä, missä edellinen edellyttää jälkimmäisen. Implikaatiota tarkastellaan 
riittävien ja välttämättömien ehtojen kautta. Väite A on B:n riittävä ehto, 
jos A:n totuus takaa sen, että myös B on tosi. Väite A on B:n välttämätön 
ehto, jos A ei voi olla tosi ilman, että B on tosi. 
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Riittävä ja välttämätön ehto implikaation avulla lausuttuna. 
1) A on riittävä ehto B:lle, A > B 
2) A on välttämätön ehto B:lle, B — A tai ei-A — ei-B 


Riittävä ja välttämätön ehto voidaan esittää myös Venn-diagrammina 
kuten kuviossa 5. 


1) Aon riittávà ehto B:lle. 2) A on välttämätön ehto B:lle. 


A 
i Emm 


Kuvio 5. Riittävä (1) ja välttämätön (2) ehto diagrammimuodossa. 


Riittävillä ja välttämättömillä ehdoilla on metodologiassa kahtalainen 
sovellusalue. Toisaalta riittävien ja välttämättömien ehtojen avulla tutki- 
taan käsitteiden määritelmien suhteita — esimerkiksi juuri käsitteiden 
tiede ja tieteellinen metodi välistä suhdetta. Riittääkö esimerkiksi tieteelli- 
sen metodin käyttö määrittämään prosessin tieteeksi? Onko metodi tie- 
teellisen tiedon välttämätön ehto? Toisaalta riittävien ja välttämättömien 
ehtojen avulla tarkastellaan kausaatiota eli predikaattilogiikassa jos- 
niin-rakennetta. Usein tieteessä pyritään selvittämään, mikä aiheuttaa 
jonkin tietyn ilmiön tai minkä toisen ilmiön kanssa tutkittava korreloi. 

Välttämätön tarkoittaa sitä, että jokin B ei voisi tapahtua tai olla olemas- 
sa ilman, että on A. Painovoima on sunnuntaikävelyn välttämätön ehto, 
kuten kieli on puheen. Kuitenkin myös moni muu seikka vaikuttaa loppu- 
jen lopuksi siihen, että joku lähtee sunnuntaikävelylle ja puhuu. Riittävien 
ehtojen joukko on yleensä välttämättömiä ehtoja suurempi. Metodologiaan 
perehtyvän opiskelijan onkin mielekästä tutustua logiikan ja tieteellisen ar- 
gumentaation perusteisiin, sillä metodin teoreettinen peruste on viime kä- 
dessä sen loogisessa rakenteessa, joka muodostaa tieteellisen argumentin 
rakenteen (esim. Allwood, Anderson & Dahl 1980 [1971]; Niiniluoto 1983). 
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Aiheesta lisaa: 
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Miettinen, Seppo K. 1993. Logiikan peruskurssi. Helsinki: Gaudeamus. 


Tieteellisen metodin määritelmä on siis loogisesti sidoksissa tieteen 
määritelmään. Seuraavaksi käsitellään tieteellisen metodin eräitä välttä- 
mättömiä ehtoja, jotka voidaan esittää kuvion 6 tapaan. Kuviossa ehtoja 
esitetään olevan kuusi, mutta jaottelu voisi olla myös toisenlainen. Fh- 
tojen keskinäinen suhde perustuu ensinnä juuri välttämättömyyteen: 
ehto 1 on välttämätön ehdolle 2 jne. Näin ehdot kytkeytyvät toisiinsa. 
Toiseksi ehdot rakentuvat jossain määrin yleisemmästä yksityisempään 
-periaatteen varaan. Esimerkiksi tieteen ehdot (ehto 1) kuvaavat yleisiä 
tieteellisen tiedon edellytyksiä, kun taas esimerkiksi logiikassa (ehto 5) ja 
etiikassa (ehto 6) korostetaan yleisten seikkojen lisäksi myös tutkimus- 
kohtaisia valintoja ja piirteitä (esim. mikroetiikka). 


1. Tieteen ehdot 


2. Tietoteoreettiset ehdot 


3. Ontologiset ehdot ja totuusteoriat 


4. Metodologiset ehdot 


5. Logiikka 


6. Etiikka 


Kuvio 6. Tieteellisen menetelmän ehdot. 
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Ehtojen suhteet voidaan kuvata laatikkomallin sijaan myös puukuviona 
kuten kuviossa 7. Puumalli mahdollistaa tieteen ehtojen esittämisen ha- 
vainnollisesti suhteessa muihin uskomuksen muodostamisen tapoihin. 


1. Uskomuksen muodostamisen tapoja 


2. Tieteellisten perustelujen muodostamisen tapoja 


formaalitieteet reaalitieteet 


3. Kielen ontologinen taustateoria 


totuusteoriat 


4. Metodologinen asemoituminen 


5. Tutkimuksen looginen rakenne 


6. Etiikka 


Kuvio 7. Tutkimuksen teoreettiset ja toiminnalliset ehdot puukuviona. 


Seuraavissa luvuissa tieteellisen menetelmän ehdot esitellään kohta koh- 
dalta alkaen tieteen ehdoista ja edeten järjestyksessä aina kuudenteen 
ehtoon eli etiikkaan asti. 
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2.2. Tieteen ehdot: uskomuksen muodostamisen tapa 


Tiede voidaan määritellä tavaksi muodostaa hyvin perusteltuja usko- 
muksia. Termillä tiede tarkoitetaankin yleensä joko tieteellisen tiedon 
tarkoituksenmukaista ja järjestelmällistä tavoittelua tai tieteen meto- 
deilla saavutettujen uskomusten systemaattista kokonaisuutta. Samalla 
termillä viitataan siis usein niin tutkimuksen tuloksiin kuin tuloksiin 
johtaneeseen tieteelliseen toimintaan, tutkimusprosessiin. 

Yleisen käsityksen mukaan tieteellisen tiedon subjekti on tiede- 
yhteisö, ei yksittäinen tutkija (Niiniluoto 19804). Ei siis riitä, että kielen- 
tutkija on tehnyt mielestään kelpo tutkimuksen ja pitää tuloksiaan 
tosina; tiedeyhteisön on hyväksyttävä tutkimuksen tulos. Tieteessä tut- 
kimuksen tulokset julkaistaan ja tutkimusprosessi asetetaan alttiiksi 
kriittiselle vertaisarvioinnille. Vasta kun tiedeyhteisö vakuuttuu väittei- 
den todenmukaisuudesta ja siitä, että tutkimuksessa käytetyt keinot ovat 
luotettavia, tutkimus hyväksytään tieteeksi. 

Tätä seikkaa voi havainnollistaa seuraavan naturalistiseen havain- 
nointiin eli kielenkäytön tarkkailuun liittyvän esimerkin avulla. Kielen- 
tutkija huomaa, että kahvilakeskustelussa eiku-partikkelia ei käytetä 
ainoastaan korjauksen keinona, toisin kuin kielitieteessä on aiemmin 
uskottu. Kutsutaan tätä uutta havaittua ilmiötä Y:ksi. Kielentutkija tal- 
lentaa keskusteluaineistoa, jonka hän myöhemmin litteroi. Analysoi- 
tuaan aineiston kielentutkija uskoo keksineensä eiku-partikkelin käytön 
selityksen Z. Yksityinen havainto ilmiöstä ja selityshypoteesin kehit- 
täminen eivät kuitenkaan ole vielä tieteellistä tietoa. Tieteellistä tietoa 
arvioidaan erityisin kriteerein, joista tieteellisen metodin käyttäminen 
on yksi ja tutkimuksen julkaiseminen toinen. Merkitystä on myös sil- 
lä, mitä julkaistaan ja missä. Vertaa esimerkiksi seuraavien julkaisujen 
näyttöä. 


1) Kielentutkija julkaisee havainnon Y, ja muu tiedeyhteisö hyväksyy, 
että tällainen havainto Y on tehty. 

2) Kielentutkija julkaisee havainnon Y ja selityksen Z, ja muu tiede- 
yhteisö hyväksyy esitetyn selityksen validiksi eli edelleen koetelta- 
vaksi tiedeyhteisössä. 
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3) Kielentutkija julkaisee havainnon Y, minkä lisäksi hän kerää ai- 
neiston A. Aineistossa A selityksen Z voidaan osoittaa pitävän paik- 
kansa kaikissa A:ssa esiintyvissä yksittäistapauksissa Y, ja tämän 
tiedeyhteisö hyväksyy. 

4) Kielentutkija julkaisee havainnon Y, minkä lisäksi hän kerää keske- 
nään erilaiset aineistot A, B ja C. Aineistoissa A, B ja C selitys Z kat- 
taa kaikki Y:n yksittäisesiintymät, ja tämän tiedeyhteisö hyväksyy. 


Esimerkkien 1-4 avulla huomataan, että tieteellinen tieto liittyy sitä tuke- 
vaan näyttöön. Kun ilmiötä edustava evidenssipohja eli aineisto on moni- 
puolista ja esitetyt argumentit sekä tutkimuksen looginen rakenne pätee 
koko aineistoon, on tiedeyhteisön hyväksymiskynnys todennäköisemmin 
ylitettävissä. Esimerkeissä voi myös vaihdella tiedeyhteisön merkitystä ja 
pohtia, millä lailla tieto on (koko) tiedeyhteisön hyväksymä, jos sen jul- 
kaisee esimerkiksi laitoksen omissa julkaisuissa, väitöskirjana, posteri- 
esitelmänä tai vertaisarvioituna artikkelina jossakin alan arvostetussa 
julkaisussa. Pelkkä havainto ja sen raportointi eivät siis vielä ole sellaista 
tieteellistä yleistettävää tietoa, joka on tieteen päämääränä. 

Tutkimus on yleisnimi systemaattiselle informaation tuottamiselle 
tai hankinnalle. Monissa yrityksissä tehdään tutkimusta, ja esimerkiksi 
tutkiva yksityisetsivä tai journalistikin tekevät tutkimusta. Tieteellinen 
tutkimus eroaa tällaisesta muusta tutkimuksesta, sillä sitä ohjaavat eri- 
tyiset tieteen pelisäännöt. Tiede on toimintana normatiivista, ja tieteel- 
listä metodia voi pitää yhtenä niistä säännöistä, joita tieteellisen tutkijan 
on noudatettava. Muita tieteen pelisääntöjä ovat tiedon perusteltavuus, 
totuudellisuus, objektiivisuus ja julkisuus. 


Tieteen pelisääntöihin kuuluvat: 


e tieteellinen metodi 
e julkisuus 

e perusteltavuus 

e totuudellisuus 

e objektiivisuus 
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Tieteen normatiivisuuden voi yleensä ymmärtää kahdella tavalla. Esi- 
merkiksi Hans Reichenbach (1938) erotti toisistaan tieteen normatii- 
visuuteen eli tieteen pelisääntöihin liittyvät kysymykset: Millä keinoin 
tietoa saavutetaan? Miten tietoa oikeutetaan? Kun tieteen pelisäännöt 
ymmärretään keinona päästä tavoitteeseen, sääntöjä voi verrata kakku- 
reseptiin: reseptissä annetaan ohjeet siihen, mitä pitää tehdä ja missä 
järjestyksessä, jotta kakusta tulee sellainen kuin on tavoitteena. Toisaalta 
tieteen pelisäännöt voidaan ymmärtää tiedon arviointikriteereinä, ja ne 
kertovat, miten tietoa oikeutetaan. Tuolloin säännöt toimivat samalla 
demarkaatiokriteereinä, eli ne erottavat tieteen ja pseudotieteen toisis- 
taan. Pelisääntöjen avulla voimme arvioida meille esitettyä tietoesitystä 
sen perusteella, onko tiedon hankinnassa noudatettu tieteelle tunnus- 
omaisia piirteitä. Tällöin tieteen pelisääntöjä voi verrata rikostutkintaan: 
jotta rikostutkimuksen tulos on oikeudessa hyväksyttävä, tutkijoiden pi- 
tää noudattaa hyväksyttyjä ohjeita ja rutiineja. 

Kitcher (1983) havainnollistaa tieteen pelisääntöjen roolia vertaa- 
malla tilannetta siihen, että esitetään kaksi kilpailevaa väitettä todelli- 
suudesta, joista toinen perustuu jumalalliseen ilmoitukseen ja toinen 
monimutkaiseen matemaattiseen todistukseen. Jumalallisen ilmoituk- 
sen maailman luomisesta saanut kreationisti vetoaa ilmestystietoon. 
Kvanttimekaniikan tutkija esittää väitteitä näkymättömistä partikkeleis- 
ta vedoten monimutkaiseen matemaattiseen kaavaan. Äkkiseltään voi 
näyttää siltä, että molemmat väitteet perustuvat intuitioon ja edustavat 
näkymättömiä asioita ja että kummankin väitteen todeksi hyväksyminen 
perustuisi pelkkään auktoriteettiuskoon. Kvanttimekaniikan laskelmat 
aukeavat kuitenkin alaan perehtyneelle samoin kuin esimerkiksi kogni- 
tiivisen kieliopin piktografiset kuviot kognitiivisen kielentutkimuksen 
harjoittajalle. Tieteessä väitteitä voi siis tarkastella kuka tahansa alan 
teorioihin ja metakieleen perehtynyt. Tieteellisiä väitteitä voi koetella 
uuden näytön tai uusien tulkintojen valossa. Tieteessä luotammekin 
viime kädessä siihen, että kullakin alalla asiantuntijat kehittävät tieteen 
pelisääntöjä kriittisesti ja että väitteitä testataan ja koetellaan niille kuu- 
luvalla tavalla. 
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Tieteellisen väitteen tai teorian hyveitä: 


e Väitteet eivät ole ristiriidassa kokemuksen kanssa. 

e Väitteet ovat yhtäpitäviä kokemuksen kanssa. 

e Väitteet ennustavat ilmiöitä. 

e Väitteet ovat teoreettisesti päteviä ja tuottavat uutta teoretisointia. 
e Väitteet selittävät yllättäviä tai uusia ilmiöitä. 


Väitteiden testaaminen on joskus kielentutkimuksessa 1900-luvulla 
ymmärretty kapeasti vain luonnontieteellisen koeasetelman kehyk- 
sessä. Nykyään se ymmärretään laajemmin tutkimuksena, jossa väit- 
teiden vastaavuutta, ennustavuutta ja selittävyyttä tarkastellaan uusien 
aineistojen, tulkintojen tai ilmiöiden valossa. Esimerkiksi kielentutkijan 
hypoteesia Z voidaan testata uusissa aineistoissa tai murteissa tai tutkia 
diakronisesta perspektiivistä. Tällainen väitteiden testaaminen tieteessä 
tuottaa ajan kuluessa vivahteikkaamman kuvan sekä selityshypoteesista 
Z että ilmiöstä Y. Huomataan esimerkiksi, että eiku-korjaus toimii jois- 
sain murteissa tai puhetavoissa yhdellä tavalla ja toisissa toisella tai että 
eiku-partikkelilla on erilaisia indeksikaalisia vivahteita, jotka vaikuttavat 
vuorovaikutuksen kulkuun. Hypoteesia Z ei siis pyritä falsifioimaan 
1930-luvun popperilaisessa joko-tai-hengessä, vaan sitä tutkitaan mo- 
nesta eri näkökulmasta ja kehitetään eteenpäin niiltä osin, kuin se to- 
teuttaa tieteellisen väitteen hyveitä. 

Thagard (1978) esittää, että tieteen normatiivisuus nousee viime kä- 
dessä yhteisön tarpeesta vaalia tieteellistä tietoa ja sen statusta tavoitelta- 
vana tiedon lajina. Kun viemme lapsemme lääkäriin, kielenopetukseen 
tai logopedin luo, emme halua, että alan ammattilainen soveltaa päivän 
horoskooppia vaan viimeisintä tutkimustietoa. Thagardin (mt.) mukaan 
käsitys siitä, mikä on viimeisintä tutkimustietoa, on tieteellisen yhteisön 
arvio siitä, miten tutkimustietoa tulee kulloinkin arvioida, koetella, kes- 
kusteluttaa ja soveltaa. Horoskooppikin ennustaa, selittää ja perustuu 
erilaisiin teorioihin. Tieteellisellä tiedolla on kuitenkin yhteiskunnan 
silmissä lisäarvoa muihin tiedon lähteisiin verrattuna. Pidämme tie- 
teellistä tietoa yhteishyvän lähteenä, ja sen tuottaminen yhteisön tar- 
peisiin perustuu eräänlaiseen yhteiskunnalliseen sopimukseen, johon 
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tiedeyhteisö on sitoutunut. Yliopiston myöntämät tutkinnot välittävät 
muulle yhteisölle tiedon siitä, kenellä on riittävä tieteellinen osaaminen 
jollakin alalla. 

Ilkka Niiniluoto (2001) on erottanut yhteishyvään pyrkivän tieteen ja 
salen. Termi sale on sanojen salaisuus ja vale yhdistelmä. Sale-tutkimus 
ei Niiniluodon mukaan täytä julkisuuden kriteerejä, vaan se sitoutuu 
yleensä kaupallisiin tai valtiollisiin intresseihin ja salaamiseen. Tiede- 
yhteisö ei siis voi arvioida, onko tutkimusprosessi luotettava ja saavu- 
tettu informaatio tosi. Tutkimuksen tuloksia ei myöskään julkaista yh- 
teisön kollektiivisena omaisuutena, vaan tavoitteena on harvojen hyöty. 
Niiniluoto argumentoi, että sale ja tiede, tutkimus ja tieteellinen metodi, 
informaatio ja tieteellinen tieto on erotettava toisistaan. Sale on tilaus- 
tutkimusta, jonka arvostelukriteerit on yleensä ilmaistu huonosti ja ne 
jättävät paljon tilaa henkilökohtaisille mieltymyksille. Tieteellisen tiedon 
luonteeseen kuuluu objektiivisuus, joka on henkilökohtaisten mielty- 
mysten vastakohta: tutkimuksen tulokset eivät ole pelkästään tutkijan 
tai tutkimuksen tilaajan subjektiivisista ominaisuuksista kiinni. Juuri 
julkinen tieteellinen prosessi varmistaa tutkimuksen toistettavuuden ja 
väitteiden intersubjektiivisuuden. Kun tutkimus voidaan periaatteessa 
toistaa tai kun voidaan ymmärtää eksplikoitua argumentointiketjua seu- 
raamalla, miten väitteeseen on päästy, voidaan verifioida, että väitteet 
ovat reaalitodellisuuden ominaisuuksista riippuvaisia eli mahdollisim- 
man objektiivisia väitteitä todellisuudesta. 


Tiede perustuu Robert Mertonin (1973 [1942]) kiteyttämiin ihanteisiin, 
jotka ovat Niiniluodon (2001) mukaan seuraavat: 


— Universalismi: väitteiden totuusarvon arviointiin eivät saa vaikuttaa 
väitteen esittäjän henkilökohtaiset ominaisuudet, kuten rotu, kansalli- 
suus, yhteiskuntaluokka tai uskonto. Kriteerien on oltava persoonasta 
riippumattomia ja kollektiivisesti hyväksyttyjä. 

— Kommunismi: tieteelliset keksinnöt ovat yhteistä omaisuutta, koska 
ne ovat sosiaalisen yhteistyön tuloksia. 
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— Pyyteettömyys: tutkijan oma ura tai arvovalta ei saa vaikuttaa tieteel- 
lisen tiedon etsintään ja erittelyyn. 

— Järjestelmällinen epäily: tieteen tuloksia tulee tarkastella kriittisesti 
sekä todellisuutta että esitystavan loogisuutta vasten. 


Ketosen (1976) mukaan keskeinen osa tiedettä on se, että tieteellinen 
väite — silloinkaan kun se on saavutettu matemaattisella, filosofisella tai 
kielitieteellisellä intuitiolla — ei ole väite tutkijan subjektiivisista ominai- 
suuksista vaan jostakin niistä riippumattomasta, erillisestä tai yhteisesti 
jaetusta ilmiöstä. Esimerkiksi Croftin (2001) tietojäsennys substantii- 
vista ei pyri kertomaan tutkijasta itsestään vaan tietystä ilmiöstä. Tieto- 
jäsennysten, väitteiden ja tieteellisten konstruktioiden tueksi esitetään 
julkisia analyyseja ja perusteluja, joilla on tieteellisen argumentaation 
rakenne, vaikka itse päätelmä on ehkä alkujaan ollut tutkijan oman in- 
tuitiivisen työn tulosta. 

Tieteellisen metodin ja argumentaation julkisuus mahdollistaa tie- 
teen itseään korjaavan luonteen. Tiedeyhteisö suhtautuu kriittisesti 
saatuihin tuloksiin; se toistaa tutkimusteemoja ja kehittää tutkimuksia 
edelleen. Toisin kuin esimerkiksi uskonnolliset tai ideologiset väitteet 
tieteellinen väite ei perustu auktoriteettiin vaan siihen, että väitteet 
asetetaan alttiiksi jatkuvalle koettelulle, ja ne hylätään, mikäli reaali- 
todellisuus on väitteiden kanssa ristiriidassa. Reaalitodellisuus on termi, 
jolla viitataan tietoesityksen eli tieteellisen taustateorian mallintamaan 
ulkopuoliseen maailmaan (ks. Johdannon luku 2.4. tk.). Termin reaali- 


todellisuus avulla voidaan siten erottaa toisistaan teorian mallintama 
maailma ja se maailma (reaalitodellisuus), josta se esittää väitteen. 
Esimerkiksi väite ”suomen kielen transitiivilauseessa voi olla partitiivi- 
subjekti” (esim. Monia opiskelijoita tekee kahta tutkintoa) on tosi ainoas- 
taan siinä tapauksessa, että reaalimaailmassa vallitsee lauseen ilmai- 
sema tila eli että kyseisenlaisia transitiivilausetyypin esiintymiä löytyy. 
Teoreettiset mallit käyttävät hyväkseen metakäsitteitä, kuten parti- 
tiivi, subjekti tai transitiivinen, joiden avulla luokitellaan ilmiöitä. Meta- 
termit määritellään koherentisti jossakin taustateoriassa, esimerkiksi 
jossakin kielenkuvausmallissa, ja niillä on sekä aineistoa että teoriaa 
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systematisoiva funktio. Kun tutkija esimerkiksi esittää, että partitiivi- 
subjektia käytetään transitiivirakenteissa, ja osoittaa aineistoesimerkein 
luokitusten pitävän paikkansa, kyse on väitteen oikeuttamisesta. 

Kielentutkimuksessa kieliopilliset luokitukset ja kieliesimerkit muo- 
dostavat keskeisen osan tieteellistä argumentaatiota. Tyypillistä on 
osoittaa esimerkiksi erilaisten minimipariesimerkkien avulla, että jo- 
kin luokittava metatermi toimii tai luokitusta koskeva yleistettävä väite 
pitää paikkansa. Esimerkit voivat olla peräisin luonnollisesta aineistos- 
ta, tai kielentutkija voi kielitajunsa avulla esittää kohdennettuja täsmä- 
esimerkkejä. Säännönmukaisuuksien osoittaminen aineistosta oikeuttaa 
kielitieteellisessä argumentaatiossa päätelmän eli yleistettävän kuvaus- 
lauseen kielestä. Tieteen päämääränä ovatkin juuri yleistettävät lauseet 
(esim. Jos Y kuuluu X:ään, niin sillä on ominaisuus Z). Tieteellinen 
teoria voidaan ymmärtää yleistettävien lauseiden tai yleispätevien ku- 
vauksien joukkona, jonka perusteella voidaan ennustaa, miten ilmiöt 
käyttäytyvät ja millaisia suhteita niillä on keskenään. 

Entä mitä ovat yleistettävät lauseet tai yleispätevät kuvaukset? Vastaus 
kysymykseen, ovatko yleistettävät lauseet tai kielentutkimuksessa käytet- 
tyjen termien referentit universaaleja, luonnollisia kategorioita, lakeja 
vai vain instrumentteja, joita käytetään aineiston systematisaatiossa (ks. 
Johdannon luku 2.4. tk.), jakaa kielentutkimuksen teoriat erilaisiin luok- 


kiin. Käsiterealistit olettavat, että kieltä kuvaavat metakäsitteet ovat jol- 
lakin tapaa itsenäisesti olemassa universaaleina. Nativistit perustelevat 
universaalien metafysiikkaa biologisin argumentein, ja empiristit yleen- 
sä kieltävät laki-käsitteen tyystin ja puhuvat reaalimaailman lainomaisis- 
ta (noomisista) ilmiöistä. Nominalistit ja instrumentalistit vuorostaan 
esittävät, että todellisuus on ihmisen konstruoimaa ja metatermit ovat 
vain käteviä työkaluja. Heidän mukaansa termit, kuten partitiivi tai tran- 
sitiivinen, eivät siis viittaa universaaleihin kielen kategorioihin, jotka ovat 
jollakin tapaa olemassa ihmisestä riippumatta, vaan ne ovat kielellisiä 
välineitä kielentutkijan tyókalupakissa.' 

Riippumatta siitä, mikä koulukunnan käsitys on metateoreettisten 
käsitteiden ontologiasta, yleensä ollaan yhtä mieltä siitä, että tieteellisten 
termien määritelmiä korjataan tutkimuksen kuluessa. Itseään korjaa- 
van luonteensa vuoksi tiedettä pidetään usein myös edistyvänä. Termille 
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tieteellinen edistys annetaan yleensä kaksi eri tulkintaa. Veristisissä teo- 
rioissa eli teorioissa, joissa tieteen päämääränä katsotaan olevan totuus, 
tieteen uskotaan hiljalleen lähestyvän totuutta. Esimerkiksi kriittisen tie- 
teellisen realismin mukaan tiede ei ehkä koskaan saavuta totuutta mutta 
siinä lausutut väitteet mukautuvat tieteellisessä prosessissa totuuden 
kaltaisiksi (Niiniluoto 1980b). Instrumentalistisissa teorioissa vuoros- 
taan katsotaan tieteen edistyvän, kun tieteellisten väitteiden käyttöala 
laajenee tai paranee. Käytettävyys ilmaisee todellisuuden ja kielen väli- 
sen mielekkään suhteen. Kun jonkin tieteellisen väitteen tuloksena on 
kantava silta, toimiva koje tai vaikkapa vieraan kielen opetukseen sopiva 
kielioppi, on väite käyttökelpoinen ja se voidaan hyväksyä tieteelliseksi. 
Uskomuksen muodostamisen eri muodot, kuten reflektio, abduktio 
ja intuitio, kuuluvat kaikilla tieteenaloilla tutkijan työkaluihin. Ero pel- 
kän uskomuksen ja tieteellisen tiedon välillä liittyy siihen intersubjek- 
tiiviseen julkiseen prosessiin, joka ohjaa tiedettä. Näennäistieteessä 1) 
uskomukseen johtaneita keinoja ja askelia ei yleensä selvennetä julki- 
sesti, 2) selitys ei noudata tieteellistä argumentaatiota, 3) tulokset eivät 
ole toistettavissa, eli ei voi koettaa, pääseekö samoihin tuloksiin uudella 
aineistolla, 4) tulokset ovat uskomuksen luojan subjektiivisista ominai- 
suuksista riippuvaisia tai 5) väitteitä ei voida testata uusilla kokeilla. 
Näennäistieteen ja tieteen rajaa pohdittaessa on mielekästä tarkastella 
tieteellisyyden kriteerejä alakohtaisesti. Tällöin puhutaan siitä, missä 
määrin ala tai tutkimussuuntaus on idiografinen tai nomoteettinen. Esi- 
merkiksi historiantutkimusta pidetään idiografisena tieteenä, joka tutkii 
ainutkertaisten historiallisten tilanteiden luonnetta ja jossa tutkimus 
rajoittuu tapahtumahistoriaan. Esimerkiksi kielitieteen historian tai yk- 
sittäisten kielenmuistomerkkien (vanhat tekstit yms., ks. Näkökulmia 
filologiseen tutkimukseen tk.) tutkimus kartoittaa tilanne- ja tapahtu- 
mahistoriaa. Aineistoa ei voi vaihtaa eikä testata uudestaan, vaikka sa- 


maa aineistoa voikin tulkita uudelleen. Tutkimuksen tieteellisyys perus- 
tuu päättelyprosessien ja lähteiden julkiseen tarkasteluun ja tieteellisen 
argumentaation rakenteeseen. Psykolingvistiikkaa tai (labovilaista) 
sosiolingvistiikkaa voidaan taas pitää nomoteettisina aloina, joiden ta- 
voite on löytää tilastollisesti merkittäviä lainomaisuuksia ilmiöistä (ks. 
Psyko- ja neurolingvistiikka tk.). 
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Asetelma nomoteettisen ja idiografisen tutkimuksen välillä voi kui- 
tenkin vaihdella jopa yhden ja saman tutkimuksen sisällä. Kielentutkijat 
ovat yleensä kiinnostuneita sekä ainutlaatuisista ilmiöistä että yleisem- 
mistä kielen kehitys- ja muutosilmiöistä. Toisinaan kielentutkimus 
keskittyy juuri idiografisen ja nomoteettisen suhteeseen: kielentutkijat 
kiinnittävät huomiota konkreettisessa, ainutlaatuisessa puhetilanteessa 
esiintyvään yleiseen seikkaan. Yleinen tarkoittaa teoriaa, jossa on yleis- 
päteviä kuvauksia. Kun kielentutkimuksessa halutaan paljastaa ilmiöi- 
den yleisiä ominaisuuksia, täytyy sitä varten olla käytössä metodologinen 
taustateoria, joka tarjoaa välineitä yksittäisen ilmiön tai havainnon luo- 
kitteluun ja vertailuun. 

Tieteen kriteerit ovat näennäistieteen vastakohtia: 1) uskomukseen 
johtaneita keinoja ja askelia selvennetään julkisesti, 2) selitykset nou- 
dattavat tieteellistä argumentaatiota, 3) tulokset ovat toistettavissa, eli voi 
koettaa, pääseekö samoihin tuloksiin uudella aineistolla, 4) tulokset eivät 
ole uskomuksen luojan subjektiivisista ominaisuuksista riippuvaisia ja 5) 
väitteitä voidaan testata uusilla kokeilla tai muuten arvioida. Kaikki koh- 
dat 1-5 sisältävät intersubjektiivisen osatekijän, jonka voidaan siten aja- 
tella kuuluvan tieteellisen metodin määritelmään: metodi on tieteellinen, 
kun se on tieteellisen yhteisön jakama ja johtaa yhteishyvään eli yhteis- 
kunnan jäsenten tasapuolisesti ulottuvilla olevaan tieteelliseen tietoon. 

Edellä on käsitelty tieteen normatiivista luonnetta ja niitä erityis- 
piirteitä, jotka erottavat tieteen muista uskomuksen muodostamisen 
lajeista. Kuviosta 8 huomataan, että kollektiivisia uskomuksen muodos- 
tamisen tapoja on useita, joista tiede on vain yksi. 


1. Uskomuksen muodostamisen tapoja 


E 
-^ 


1 
1 
- 


- 


Kuvio 8. Uskomuksen muodostamisen tapoja. 
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Seuraavaksi pohditaan tarkemmin sitä, millä tavalla tieteellistä usko- 
muksen muodostamisen tapaa voidaan paremmin ymmärtää tieto- 
teorian kautta. Tietoteoria vastaa muun muassa seuraaviin kysymyksiin: 
Miten tietoa saavutetaan? Mistä tietää, että uskomus on tietoa? Voiko 
tieto olla tietoa ilman, että kukaan osaa sitä perustella? 


2.3. Tietoteoreettiset ehdot 


Tieto-oppi (tietoteoria, epistemologia) on ala, joka tutkii tietämistä ja 
tietoa. Useimpien tietoteoreettisten? käsitysten mukaan tieteellinen tie- 
to ei ole ainoa tietämisen muoto. Tieto ja tieteellinen tieto eivät siis ole 
synonyymejä. Matti voi esimerkiksi tietää, että hänen nimensä on Matti, 
että koiraa kutsutaan suomen kielessä koiraksi tai että Matilla itsellään 
on kaksi kättä. Tällainen subjektiivinen yksittäistieto ei kuitenkaan ole 
tieteellistä, koska tiedon subjekti ei ole tässä tapauksessa kollektiivi eli 
tiedeyhteisö ja tiedon kohteena olevat propositiot eivät ole käyneet läpi 
tieteelliselle väitteelle kuuluvaa julkista prosessia eli julkaisua, väittelyä, 
koettelua ja vakiintumista. 

Tieteellisellä tiedolla on myös muita erityisominaisuuksia. Tietees- 
sä tavoitteena ovat yleispätevät kuvaukset: niillä katsotaan olevan en- 
nustavaa arvoa, jonka avulla voidaan tehdä deduktiivisia päätelmiä. Jos 
esimerkiksi tiedämme, millaisia yleisiä ominaisuuksia ihmisillä on, 
voimme tämän tiedon perusteella johtaa yksittäistapauksia koskevia 
päätelmiä ja tällä tavoin myös koetella teoriaa (esim. ”Matti on ihmi- 
nen, joten hänellä on lajimääritelmän mukaan edellytykset siihen, että 
hänellä on kaksi kättä”). Tieteellinen teoria voidaankin määritellä juuri 
yleispätevien kuvausten joukoksi, joka antaa koherentin kokonaiskuvan 
jostakin ilmiöstä. Toisin sanoen Matin henkilökohtainen tieto siitä, mil- 
lä suomen kielen sanalla koiraa nimitetään, ei vielä yksinään kiinnosta 
tiedettä, mutta tämä tieto esimerkiksi osana leksikaalista semantiikkaa 
voi johtaa mielenkiintoisiin tutkimuskysymyksiin, joiden vastauksissa 
on kieltä koskevia yleispätevyyksiä. 

Ollakseen tietoa yleistettävällä lauseella tulee olla totuusarvo. To- 
tuutta koskevat teoriat perustuvat tietoteoriaan. Platon loi nykytieteen 
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perustana olevan klassisen tietoteorian määrittelemällä tiedon hyvin 
perustelluksi todeksi uskomukseksi teoksessaan Theaitetos. Tietämisen 
loogisen rakenteen voi esittää seuraavasti: 


A tietää, että P, jos ja vain jos 

— A uskoo, että P. 

— A:lla on pätevät perustelut uskoa, että P. 
— Pon tosi. 


Tiedon määritelmäksi ei siis riitä se, että A uskoo, että hän on voitta- 
nut lotossa, ja että uskomus toteutuu eli A todella on voittanut lotossa. 
Mikäli A:lla ei ole perusteita uskomukselleen, kyseessä ei ollut tieto 
vaan pelkkä uskomus. A ei tiennyt voittavansa, koska hänellä ei olisi 
ollut päteviä perusteita uskolleen. Tieto on siis relaatio subjektin kogni- 
tiivisen tietämisen tilan (uskomus), maailmassa vallitsevan asiantilan 
(tiedon kohde) ja uskomusta puoltavien argumenttien (tiedon sisältö) 
välillä. 

Maallikon A sujuva kielitaito ei sekään ole tieteellistä tietoa, vaikka 
kaikki A:n uskomukset kielestä L olisivatkin oikeita eli tosia. Tieteelli- 
sen tiedon perustelut ovat julkisia, ja tiedon subjekti on tiedeyhteisö. 
Tämä tarkoittaa sitä, että tutkimusjulkaisun päämäärä on muuttaa tiede- 
yhteisön kognitiivinen asenne epäuskosta uskoon esittämällä vakuutta- 
vasti perustelut sille, miksi P on tosi. Tieteellinen argumentaatio perus- 
tuu siis vakuuttavien argumenttien esittämiselle. 

Tieteellisen argumentaation tulee olla loogista ja koherenttia ja 
siinä olevien merkityssisältöjen perustua yhteen yhtenäiseen käsite- 
järjestelmään. Oleellinen osa tieteellistä argumentaatiota on tieteelli- 
nen käsitteenmuodostus. Teoreettisen termin referentti (eli tarkoite tai 
kohde) on teoreettinen konstruktio, jonka määritelmä on osa jotakin 
tieteellistä teoriaa. Termeillä genetiivi ja kvantti on olemassa luonnol- 
lisessa puheessa yleensä maallikon ymmärtämä yleismerkitys, mutta 
tieteenharjoittaja tuntee alansa koulukuntakiistat ja tieteellisen termin 
aseman käsitejärjestelmän kokonaisuudessa ja siksi harvoin pitää teo- 
reettisten termien merkityksiä lukkoon lyötyinä. Teoreettisten termien 
määritelmä vaihtelee myös eri teorioissa ja muuttuu tutkimuksen 
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myötä. Harvinaista ei ole sekään, että tutkimuksen kuluessa ilmenee 
sellaisia yllättäviä seikkoja, jotka muuttavat niin tutkijan omaa kuin 
tiedeyhteisönkin maailmankäsitystä ja näin myös termin sisältöä. 
Tieteessä erilaiset teoreettiset ja operationaaliset termit muodostavat 
havaintokäsitteistön. Esimerkiksi erilaiset fonetiikan ja fonologian luo- 
kitukset kategorisoivat äänihavaintoa. Varsinaisen havaintokeinon muo- 
dostaa itse tieteellinen metodi, ja taustateoria taas kertoo, millä tavalla 
ilmiöt liittyvät toisiinsa (Putnam 1977). Usein viittausten kohteena ole- 
vaa reaalimaailmaa edustaa jokin aineisto, johon viitataan. Sellaisen väit- 
teen kuin ”partikkelilla eiku reagoidaan välittömästi korjausta vaativaan 
seikkaan” tueksi voidaan tieteellisen argumentaation kuluessa vedota 
aineistoesimerkkeihin, joissa tämä havaittu seikka ilmenee (ks. Keskuste- 
lunanalyysi ja vuorovaikutuslingvistiikka tk.). Aineiston hankintatapa on 
kullekin kielentutkimuksen haaralle ominainen ja täyttää sen teorioiden 
asettamat kriteerit. Tutkittaessa ilmiöitä, joissa esiintyy suurta vaihtelua 


ja variaatiota, kuten keskusteluja, äänitetään yleensä kymmeniä tunteja 
erilaisia keskustelutapauksia, kun taas ääntämistä koskevia rakenteita eli 
fonetiikkaa tutkittaessa pienempikin aineisto riittää. 

Tieteellisen argumentaation ja analyysin vakuuttavuus sisältyy tutki- 
jan puhetekoon, joka johtaa ihanteellisessa tapauksessa uudistavaan vai- 
kutukseen tiedeyhteisössä: epäusko muuttuu uskoksi siten, että tiede- 
yhteisö alkaa tietää jotakin. 


Tiedeyhteisö uskoo, että P. 

Tiedeyhteisöllä on pätevät perustelut uskoa, että P. 

P on tosi. 
Tieteessä tutkimusjulkaisu koostuu väitteestä ja sen perusteluista. Pe- 
rustelujen tavoitteena on vakuuttaa tiedeyhteisö väitteen todenperäi- 
syydestä. Perusteluja on karkeasti katsottuna kahdenlaisia, ja niiden 
mukaan voidaan tieteenalat jakaa karkeasti formaalitieteisiin ja reaali- 
tieteisiin? Tätä jakoa käyttäen voidaan havainnollistaa eroja päätelmien 


tekemisen ja todistamisen menetelmän välillä. 
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Formaalitieteita ovat esimerkiksi logiikka ja matematiikka. Propositio- 
logiikan ja matematiikan aksioomajärjestelmä tarjoaa todistamisen mene- 
telmän eli menetelmän, joka todistaa tai tuottaa oikeita (tosia) propositio- 
logiikan tai aritmetiikan teoreemoja. Kuka tahansa, joka tuntee merkkien 
2 + 2 = 4 merkityksen, vakuuttuu päätelmän todenmukaisuudesta, koska 
aksioomajärjestelmään perustuva argumentaatio vakuuttaa järkemme. 
Järkemme vakuuttuu tahtomattamme, sillä aksioomajärjestelmä perus- 
tuu Aristoteleen (1994) mukaan loogiseen välttämättömyyteen: teoria 
ilmaisee asiantiloja, jotka eivät voisi olla muuten kuin ovat. 

Aksioomajärjestelmistä johdettuja tosia lauseita on pidetty universaa- 
leina, analyyttisina ja välttämättöminä. Perustelut todistavat lauseet. Toi- 
sin sanoen aksioomajärjestelmistä johdetut lauseet eivät ole esimerkiksi 
kieliyhteisön, kulttuurin tai aikakauden normi- ja merkitysjärjestelmistä 
riippuvaisia: 2 + 2 ei kehittynyt kolmesta neljäksi, eikä tuloksen voi odot- 
taa muuttuvan ajan kuluessa viideksi. Jos joskus löydämme toiselta pla- 
neetalta elämää, on varsin todennäköistä, että universumin toisellakin 
puolen määrien yhdistäminen noudattaa periaatetta 2 + 2 = 4. 

Kielentutkimus kuuluu reaalitieteisiin siitä huolimatta, että se on 
usein teoreettista ja käyttää toisinaan aksiomaattisia tai aksiomaattis- 
tyyppisiä järjestelmiä kielen analyysissa. Reaalitieteisiin voidaan lukea 
kaikki sellaiset tieteet, joiden tutkimuskohde kuuluu reaalimaailmaan 
ja joissa väitteen voi kumota tai väitettä voi vahvistaa reaalimaailmaa 
koskevalla aineistolla. 

Joissain reaalitieteissä, kuten kielentutkimuksessa, on mielekästä teh- 
dä ero normiproposition ja normilauseen välillä. Normipropositio on 
väite todellisuudesta (esim. ”talossa-sana on suomen kirjoitetun yleis- 
kielen talo-sanan yksikön inessiivi”), kun taas normilause on ilmaus kor- 
rektista tai oikeaksi oletetusta ilmiöstä (esim. ”talossa on korrektia suo- 
mea”). Myös esimerkiksi oikeustiede tutkii yleensä normipropositioita 
(mitä laki tosiasiassa on) ja oikeusdogmatiikka normilauseita (mitä la- 
kien tulisi olla). Normilauseet johdetaan yleensä järjestelmän sisäisis- 
tä suhteista, kun taas normipropositiot vuorostaan viittaavat johonkin 
maailmassa vallitsevaan tilaan. (Oikeustieteestä ks. esim. Kaisto 2005.) 

Kielijärjestelmä itsessään on loogisesti kontingentti eli ei-välttämätön. 
Kontingenttia on esimerkiksi se, että vaikka on totta, että Sauli Niinistö 
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oli vuonna 2017 Suomen tasavallan presidentti, silti olisi voinut olla 
myös toisin. Voidaan esittää joukko tapahtumia, jotka uskottavasti oli- 
sivat voineet muuttaa historian kulkua. Fi siis ole välttämätöntä, että 
Niinistö olisi ollut tasavallan presidentti vuonna 2017, vaikka väite on 
tosi. Kontingentit väitteet ovat kumoutuvia ja korjautuvia: osa historian, 
lääketieteen ja kielentutkimuksen väitteistä korvataan uusilla väitteillä, 
tai ne kehittyvät tarkemmiksi tieteen edistyessä. Usein väitteen ala eli 
ekstensio muuttuu myös reaalitodellisuudessa: vuoden 2067 president- 
tiä emme tiedä varmuudella sen perusteella, että tunnemme nykytilan. 
Suomen kieli järjestelmänä on pitkän kehityksen tulos. Emme varmas- 
ti voi siksi myöskään sanoa, miltä suomen kieli näyttää sadan vuoden 
kuluttua. 

Kielentutkimuksen ja yleensäkin ihmistieteellisen tiedon erityis- 
luonteeseen kuuluu myös, että tieteellinen tieto voi muuttaa tutkimus- 
kohdettaan. Oppikirja Newtonin painovoimakäsityksestä ei voi vaikuttaa 
painovoimaan, mutta kielioppi voi vaikuttaa kieliyhteisöön ja pystyy vai- 
kuttamaan sen jäsenten käytökseen (Määttä 2000). Ihmisen kielellinen 
käytös ei siten pelkästään ole kontingenttia ja ajassa muuttuvaa, vaan se 
voi myös muuttua tieteellisin keinoin tehdyn kuvauksen vaikutukses- 
ta (mt.). Usean kielen tutkimuksessa voidaankin määrittää aika ennen 
ensimmäistä (koulu)kielioppia ja sen jälkeinen aika. Kieliyhteisön kä- 
sityksillä (standardi)kielestà on taipumus vaikuttaa kielen kehitykseen. 

Kieli on siis muutosherkkyydessään hyvin erilainen kuin formaali- 
tieteen aksioomajärjestelmä, joka on muuttumaton, ja juuri siksi se on 
perustelujen muotokieli. Reaalitieteissä vuorostaan käytetään luonnol- 
lista kieltä tieteellisessä argumentaatiossa ja erilaisia tieteellisiä meto- 
deja, joiden tukena hyödynnetään toisinaan matemaattis-tilastollisia ja 
loogisia välineitä. Reaalitieteissä empiirisellä näytöllä eli evidenssillä on 
argumentaatiossa yleensä keskeinen rooli. Käsitettä empiirinen evidenssi 
ei tule tässä kontekstissa ymmärtää liian kapeasti esimerkiksi tiukasti 
aikaan ja paikkaan sidottuna havaintometodein saatuna aineistona vaan 
erityisesti reaalimaailmaan viittaavana materiaalina, jota vasten väitteitä 
ja teorioita pitkällä aikavälillä verrataan. 

Reaalitieteissä on eri aloilla käytössä erilaisia menetelmiä, joiden 
avulla aineistoja a) kerätään, b) systematisoidaan ja kategorisoidaan 
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sekä c) tulkitaan. Eräissä metodeissa aineiston keruu ja tulkinta liittyvät 
tiiviisti toisiinsa. Menetelmä on prosessi, jonka aikana kategorisointi, 
mittaus ja joiltain osin myös tulkinta tapahtuvat samanaikaisesti. Reaali- 
tieteellisissä julkaisuissa on siksi oleellista avata tutkimusasetelma ja 
prosessin kulku mahdollisimman tarkasti. 

Tieteellisessä argumentaatiossa menetelmän kuvaus muodostaa osan 
väitteen perustelua ja selittää sen, miten väitteeseen on päädytty ja miksi 
tiedeyhteisön tulisi hyväksyä väite todeksi. Kielitajun varassa operoivan 
kielentutkimuksen voi ajatella kielentutkimuksessa muodostavan tie- 
teellisessä argumentaatiossa poikkeuksen, sillä se ei näyttäisi aina sel- 
ventävän tarkasti tutkimusaskeliaan. Implisiittisen kielitiedon systema- 
tisaatio on kuitenkin kielentutkimuksessa välttämätön aktiviteetti, johon 
perustuu moni muu alan tutkimustekniikka (ks. Kielitaju kielentutkijan 


työkaluna tk.). 


Jako formaalitieteisiin ja reaalitieteisiin on karkea, ja tällaisen suur- 


piirteisen kategorisoimisen motivaatio ja konteksti on yleensä ollut 
tietoteoreettisten käsitteiden tai tieteenfilosofisten perusongelmien sel- 


ventäminen. Tieteenfilosofia itse on käsiteanalyysia (ks. Käsiteanalyysi 
kielentutkimuksessa tk.), eikä se siten sovi ongelmitta kumpaankaan 


kategoriaan. Käsitteiden analyysissa eritellään ja selkeytetään tunnettu- 
jen termien ja käsitteiden merkityksiä ja keskinäisiä suhteita. Tieteen- 
filosofiassa käytetään usein tukena myös formaalis-loogisia välineitä. 
Tieteenfilosofia ei kuitenkaan tästä huolimatta ole formaalitiede — kuten 
ei kielentutkimuskaan -, jossa päädyttäisiin universaaleihin ja ajatto- 
miin totuuksiin tieteellisten käsitteiden merkityksestä. 

1900-luvulla käsitys tieteestä oli nykyistä kapeampi ja tieteen kenttä 
jaettiin usein dikotomisesti luonnontieteisiin ja formaaleihin tieteisiin 
unohtaen useimmiten tyystin humanististen tieteiden erikoisluonne. 
Tässä kahtiajaossa pyrittiin luokittamaan kaikki tieteenalat. Siksi esi- 
merkiksi kysymys siitä, mikä on kielitieteen perimmäinen luonne, pu- 
hutti joitakin tutkijoita Suomessa 1970-luvulla: onko kielitiede formaa- 
lia tiedettä vai luonnontiedettä? Chomsky ja autonomisen kielitieteen 
koulukunnan jäsenet esittivät, että kielitiede perustaisi metodologiansa 
rationalistiseen premissiin eli käsitykseen siitä, että kielentutkimuksen 
kuuluu kohdistua sisäsyntyisiin universaaleihin rakenteisiin, joihin 
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tutkijalla on intuitiivinen pääsy. Chomskyn käsityksen mukaan kielitiede 
oli luonnontiedettä mutta samalla formaalia analyysia. Autonomista 
kielitiedettä vastustavat taas väittivät päinvastaista. 

1970-luvun suomalaista keskustelua kielitieteen luonteesta leimaa 
ainakin kaksi käsitteellistä vääristymää, jotka johtivat usealla tahol- 
la erheellisiin päätelmiin. Ensiksi kielitiede samastettiin yksinomaan 
autonomiseen kielitieteeseen (ks. esim. Lyas 1971). Empiiristä evidens- 
siä käyttäviä kielentutkimuksen aloja harvoin sisällytettiin keskusteluun. 
Samaan aikaan luonnontieteet, empiiriset tieteet ja eksperimentaatio 
ymmärrettiin usein samana kategoriana. Kategoriavirhe johti päätel- 
mään, että luonnontiede on empiiristä ja eksperimentaalista ja kaikki 
empiirinen tutkimus vuorostaan välttämättä luonnontiedettä. Käsitys on 
kuitenkin virheellinen: teoreettinen fysiikka on luonnontiede (mutta ei 
empiiristä), mutta esimerkiksi geologia ei ole eksperimentaalista (mutta 
on empiiristä). Taiteen ja kirjallisuuden tutkimus on aineistolähtöistä 
(empiiristä) mutta harvoin eksperimentaalista — eikä kulttuurin- 
tutkimuksena koskaan luonnontiedettä. 

Tällaisten aiemmin käytyjen debattien tutkiminen on hedelmällistä 
sikäli, että ne osoittavat vallitsevien tiede- ja tieteenalakäsitysten voimak- 
kaan vaikutuksen tieteenfilosofisessa keskustelussa. Erilaisten kategoria- 
virheitten puitteissa keskustelua käytiin Virittäjä-aikakauslehdessä 
1970-luvulla vieläpä dikotomisesti joko-tai-akselilla: kielitiede nähtiin 
joko formaalitieteenä tai empiirisenä luonnontieteenä. Ongelmana oli, 
että kielitiede ei näyttänyt soveltuvan selväpiirteisesti kumpaankaan 
kategoriaan. 

Esimerkiksi Esa Saarisen (1975) mukaan kielioppi ei ole sellainen 
aksiomaattinen järjestelmä, joka tuottaisi tosia sääntölauseita tai lausei- 
ta. Produktiivinen kielioppi tuottaa kieliopillisia lauseita, ei tosia. Kieli- 
oppia ei voi osoittaa oikeaksi formaalisten tieteiden ristiriidattomuudella 
tai täydellisyystodistuksiin verrattavilla yleisillä todistuksilla. Kielitiede 
olisi siis tässä mielessä empiirinen tiede. Tässä keskustelussa kysymys 
kielentutkimuksen luonteesta rajoittuu päätelmiin kieliopin mukaisten 
lauseiden luonteesta. Koko kielitieteen laajaa metodikirjoa tai niitä me- 
todeja ja tutkimusnäkökulmia, joilla jo yksinomaan kielioppia voi tutkia, 
ei tuolloisessa keskustelussa ole otettu huomioon. 
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Esa Itkonen (1997, 8—9) antoi joukon a priori -tyyppisiä määritel- 
miä’ kielen normeille: "[jJos niiden [kielen normien] tiedetään olevan 
tosia, ne eivät ole falsifioitavissa, mikä taas tarkoittaa niiden olevan 
ei-empiirisiä ja siten tietyssä mielessä apriorisia” (ks. myös Itkonen 
1975, 399).* Kuten monet muutkin tutkijat Itkonen tavoitteli hyvää 
määritelmää intuitiiviselle kielitiedolle. Itkonen tunnisti, että kieli- 
tieteilijän intuitio on ohittamaton kaikilla kielentutkimuksen aloilla, ei 
vain generativistisessa metodiikassa. Itkonen käyttää perusteluissaan 
termiä falsifikaatio, joka on Popperin (2002 [1934]) tieteenfilosofiaan 
kuuluva periaate, joka vaatii, että tieteellisiä teorioita tulee voida testata 
aineiston valossa. Sen mukaan sellainen teoria, jota ei voida testata, 
esimerkiksi freudilainen psykoanalyysi tai uskonnollinen dogma, ei ole 
tieteellinen. Teorian falsifioimattomuus ei kuitenkaan muuta teoriaa 
tai sen esittämiä väitteitä puhtaan aprioriseksi tiedoksi, kuten tauto- 
logiat ”poikamies on naimaton mies” tai 2 + 2 = 4. (Ks. Konstenius 
2014, 130-152.) 

Tavoittamatta kielitieteen tietoteoreettista perusongelmaa, joka liittyy 
juuri kielitajun tieto-oppiin, Ketonen (1975), Dahl (1975) ja myöhem- 
min Niiniluoto (1990) vastasivat Itkoselle, että sosiaaliset normit, kie- 
len sääntölauseet, ovat kontingentisti eli ei-välttämättä tosia, eivät siis 
a priori -totuuksia. Kielioppiesityksen ”totuus” voidaan osoittaa todeksi 
esimerkiksi käymällä läpi aineistoa, jossa ihmisten tai eri ihmisryhmien 
todellinen kielenkäyttö toteutuu (Ketonen 1975, 197). Kieli on erilaisten 
muuttujien yhteisvaikutuksen summa: jos esimerkiksi englannin kielen 
kehitys alkaisi aivan alusta, se voisi olla joiltain osin toinen ja siten myös 
kielellisen kehityksen lopputulos, nykyinen englannin kieli, olisi joiltain 
osin erilainen. (Ks. myös Konstenius 2014, 129-136.) 

Edellä kuvattu keskustelu havainnollistaa tapaa, jossa puoli vuosisataa 
sitten on yläkategorioita käyttämällä pyritty kielitieteen metateoriassa 
päättelemään jotakin pysyvää kielen ja kielitieteen luonteesta. Modernin 
tieteenfilosofian mukainen lähestymistapa on tarkastella laaja-alaisesti 
eri kielitieteen aloja ja kielitieteen metodiikkaa niiden omilla ehdoilla ja 
päätellä näitä aloja tutkimalla jotakin yleistä kielentutkimuksen luon- 
teesta (Achterhuis 2001). Tutkimuksen suunta on siis alhaalta ylös, 
konkreettisesta (tutkimustoiminnasta) abstraktiin (käsiteanalyysiin). 
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Laajamittainen kielitieteen metodiikan tarkastelu osoittaa kielitieteen 
aseman ja luonteen reaalitieteissä. Reaalitieteiden metodologia alkoi ke- 
hittyä varsinaisesti 1600-luvun kuluessa, kun oivallettiin, että keräämällä 
systemaattisesti erilaisia aineistoja ja rakentamalla tutkimusasetelmia, 
joilla on looginen rakenne, voitiin perustella pätevästi reaalimaailmaa 
koskevia väitelauseita. Reaalitieteissä tutkimuksessa käytettyjen aineis- 
tojen ja metodien tulee pystyä perustelemaan väite. Väitteiden paikkansa 
pitävyyttä arvioidaan yleensä erilaisten aineistojen valossa ja eri näkö- 
kulmista. Esimerkiksi suomalaisessa kielentutkimuksessa E. N. Setälän 
astevaihteluteorian perusteluja on selvitelty ja tutkittu laajasti (esim. Kor- 
honen 1986, 129-133). Setälän mukaan astevaihtelu oli kuulunut jo urali- 
laisen kantakielen morfofonologiseen järjestelmään ja käsittänyt alkuaan 
koko konsonantiston lisäksi myös vokaaliston. Selvittämällä ilmiön ikää 
ja levinneisyyttä suomessa ja sukukielissä on Setälän väitteiden perus- 
telut kumottu toistuvasti vastaevidenssin valossa. Juuri kielellisten ai- 
neistojen käyttäminen esitettyjen väitteiden ja teorioiden luotettavuuden 
kriteerinä osoittaa kielentutkimuksen paikan reaalitieteiden joukossa. 
Siksi kuviossa 9 kielentutkimus on sijoitettu tieteellisten perustelujen 
pääasiallisen muodostamisen tavan mukaan reaalitieteisiin. 


1. Uskomuksen muodostamisen tapoja 


muut tavat 


Kuvio 9. Tieteellinen tieto on perusteltu (tosi) uskomus. 
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2.4. Ontologiset ehdot 


Edellisessä luvussa käsiteltiin kysymystä, miten kielentutkimuksessa 
ratkaistaan se, onko väitteen perustelu pätevä, eli mikä on kielen- 
tutkimuksen tieto-oppi. Todettiin, että kielentutkimus kuuluu reaali- 
tieteisiin, sillä sen tutkimuskohde on eräs reaalimaailman osa. Reaali- 
tieteille on tyypillistä tarve määrittää tutkimuskohde: Millaiseen ilmiöön 
maailmassa tutkimus kohdistuu? Miten se havaitaan tai tunnistetaan? 

Tässä johdannon luvussa tarkastellaan lähemmin kielen ontologiaa 
eli sitä, miten kielentutkimuksen kohde määritellään. Jotta missään tut- 
kimuksessa voidaan soveltaa tieteellistä metodia, täytyy ensiksi määritel- 
lä tutkimuksen kohde ja kertoa, millä tavoin tästä kohteesta tutkimuk- 
sen kuluessa saadaan tietoa. Metodin sovellus reaalitieteissä on siis aina 
tietynlaisen ontologisen ja tieto-opillisen premissin yhdistelmä. Tietees- 
sä tutkimuskohdetta koskeva määritelmä hyvin harvoin on kuitenkaan 
vain lauseen mittainen, sillä se on osa laajempaa taustateoriaa. Tällai- 
sen teorian määritelmät sisältävät välttämättä eriasteisia ontologisia 
sitoumuksia kiinnittäessään tutkimuksen kohteen taustateoriassaan 
muihin ilmiöihin: ne kertovat, mitä maailmassa on ja miten maailman 
oliot liittyvät toisiinsa. 

Quinen (1948) mukaan tieteellisen teorian käsitejärjestelmä tekee 
ontologisia sitoumuksia todellisuuden perimmäiseen luonteeseen ja 
joukkoon yläkäsitteitä. Tieteellinen teoria vastaa onttiseen kysymykseen 
(engl. ontic guestion) eli kysymykseen siitä, mitä maailmassa on, ja tekee 
näin eksistenssiväitteitä, joita voidaan puolestaan kutsua ontologiseksi 
tai onttiseksi listaksi. 


Onttinen kysymys: Mitä on olemassa maailmassa? 
3x (x on...) 


Metafyysinen kysymys: Mistä maailman perimmäinen olemus on tehty? 
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Quinen (1948) mukaan vastaus onttiseen kysymykseen on listamai- 
nen: ”maailmassa on numeroita, olioita, syitä, seurauksia jne.”. Onto- 
logisessa tutkimuksessa käytetään eksistenssikvanttoria 3 'on olemassa’. 
Tieteellisessä teoriassa se kattaa teorian tekemät väitteet ilmiöiden ja 
suhteiden olemassaolosta. Ouinen (1948) mukaan käyttäessään tiettyä 
käsitejärjestelmää tieteellinen teoria välttämättä sitoutuu jonkinlaisiin 
oletuksiin maailmasta. Teoria sanoo tavallaan, että ”jos tämä teoria on 
tosi, niin nämä ja nämä oliot ovat välttämättä olemassa teorian mallin- 
tamassa maailmassa”. 

Onttista listaa voidaan parhaiten kuvata ilmitodellisuuden ja erilais- 
ten abstraktien käsitteiden listaksi, joka käsittää kaiken, mistä teoria 
puhuu. Esimerkiksi generatiivisen ja kognitiivisen kielitieteen onttinen 
lista on monessa kohdin toinen toisensa poissulkeva ja siten kilpaileva: 


generatiivinen kielitiede: 3x (x on synnynnäinen kompetenssi, kom- 
putationaaliset mallit, kielen omaksuminen, universaalikielioppi jne.) 


kognitiivinen kielitiede: 3x (x on opittu kielikyky, konnektionistiset 
mallit, kielen oppiminen, kieliopin käyttöpohjaisuus jne.). 


Kilpailevatkin kieliteoriat jakavat yleensä kuitenkin kielentutkimuksen 
peruskäsitteistön ja olettavat, että voidaan hyväksyä olevaksi joukko 
perustavanlaatuisia kieli-ilmiöitä: 


3x (x on lekseemi, leksikalisoituminen, lause, kysymyssanat jne.). 


Onttinen lista kattaa siis sen käsitteistön, jolla kuvataan jotakin olemas- 
sa olevaksi. Onttinen lista ei ole sama asia kuin vastaus metafyysisiin 
kysymyksiin ”Mistä oliot on tehty? Mikä on olioiden perimmäinen subs- 
tanssi? Onko kaikki ainetta? Onko aine eri kuin tietoisuus? Nouseeko 
tietoisuus aineesta?”. 

Termi ontologia on käytössä usein monimerkityksellinen, ja tämä ai- 
heuttaa toisinaan arkitutkimuksessakin ristiriitaisuuksia ja hämmen- 
nyksiä teoreettiseen päättelyyn. Ontologialla voidaan tarkoittaa seuraavia 
seikkoja: 
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1) eksistenssioletuksia (eli onttisuutta), 

2) olemassa olevan olion perimmäistä luonnetta (eli metafysiikkaa), 
3) tutkimusalaa tai 

4) kysymyksiä näistä kaikista kolmesta. 


Kun kielentutkimuksessa puhutaan kielen ontologiasta, on siis miele- 
kästä pohtia, mitä kirjoittaja viime kädessä tarkoittaa edellä kuvatuista 
neljästä mahdollisesta ontologian merkityksestä. Tässä johdannossa käy- 
tetään termiä onttinen eksistenssioletuksista (3x), termiä onttinen lista 
joukosta todellisuuden olioita, jotka ovat olemassa jossakin teoriassa, ja 
termiä metafyysinen niistä oletuksista, jotka koskevat todellisuuden pe- 
rimmäistä luonnetta. Ontologiaksi vuorostaan kutsutaan tässä sitä alaa, 
jossa tutkitaan kaikkia näitä kysymyksiä. 

Yleensä jokainen kielentutkija pohtii jossakin vaiheessa kysymystä, 
onko havaitun puheensorinan tai luetun tekstin takana jokin kielen 
perimmäinen luonne. Onko kieli viime kädessä sosiaalinen normisto, 
jokin abstrakti järjestelmä, biologisesta rakenteestamme kumpuavaa 
symbolien manipulaatiota tai jotain muuta? 

Ilmitodellisuuden ja perimmäisen substanssin eroa pohti jo Imma- 
nuel Kant Puhtaan järjen kritiikissään (1981 [1781]). Kantin mukaan nou- 
menon on todellisuuden perimmäinen olemus, jonka kanssa olemme 
tekemisissä fenomeenin eli ilmiöiden välityksellä. Ainoastaan ilmiöt ovat 
meidän havaintomme ja kokemuksemme ulottuvilla. Kielitieteellisessä 
arkitutkimuksessa yleensä käsitellään kieli-ilmiöitä sitoutumatta käsi- 
tyksiin kielen metafyysisestä perimmäisyydestä (ks. myös Johdannon 
luku 3 tk.). Tällaisessa arkitutkimuksessa siis usein riittää oman tausta- 
teorian onttisen listan hahmottaminen ja sen kysymyksen esittäminen, 


onko tämä lista yhteensopiva käytetyn metodin eksistenssioletusten 
kanssa. 

Koska kielitieteen metodit on osittain sidottu kielen metafyysisiin 
perusteisiin, kysymys maailman perimmäisestä rakenteesta on tullut 
osaksi myös kielentutkimuksen metodologiaa. Esimerkiksi generatii- 
vinen autonominen kielitiede perustaa metodinsa dualistiseen (ma- 
teria vs. mieli) naturalismiin: kieli on tämän näkemyksen mukaan 
viime kädessä biologiaa, sillä kielijärjestelmää ohjaa mentaalinen 
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universaalikielioppi-moduuli (UG), joka sijoittuu aivoihin. Tällaista kä- 
sitystä vastustavat koulukunnat ovat usein sitoneet metodinsa vastakkai- 
seen argumenttiin. Kysymys, kuinka monesta erilaisesta substanssista 
maailman oliot on tehty, ei siksi ole kielitieteilijälle triviaali vaan johtaa 
erilaisiin tutkimuskäsitteistöihin, teorioihin ja päätelmiin. 

Metafyysisten sitoumusten määrän mukaan teoriat voidaan jakaa 
monismiin, dualismiin ja pluralismiin. Monistit esittävät, että oliot on 
tehty yhdestä aineesta, esimerkiksi ideoista, fysikaalisista elementaari- 
partikkeleista tai jostakin neutraalista substanssista. Dualistit useimmi- 
ten esittävät, että tietoisuus ja fysikaalinen ovat kaksi erillistä substans- 
sia (mieli vs. keho). Pluralistit taas olettavat usean keskenään erilaisen 
substanssin muodostavan maailman. 

Sekä dualistit että pluralistit olettavat, että ajallis-paikallinen havaittu 
kieli (puhe, viittoma, kirjoitettu teksti) ja sen taustalla oleva abstrakti jär- 
jestelmä (normit, säännöt, UG) ovat eri asioita. Metafyysisen dualistin 
ja pluralistin ongelmana on useamman kuin yhden substanssin synty- 
mekanismin selittäminen uskottavalla tavalla. Miten materiasta syntyy 
jotakin ei-materiaalista, kuten tietoisuus, tai toisin päin? Missä ja miten 
on olemassa ei-ajallis-paikallinen substanssi, jos sillä ei ole fysikaalisia 
ulottuvuuksia? Metafysiikassa uusien substanssien selittäminen eroaa 
fysikaalisesta tai biologisesta selityksestä, sillä ei-materiaalista eivät voi 
koskea materiaaliset selitykset. Pluralistia koskee siis raskas todistamisen 
taakka tieteessä, joka vaatii kertomaan, mitä kaikki uudet substanssit ovat, 
miten ne ovat syntyneet ja mikä niiden suhde on toisiinsa (ks. Johdannon 
luku 3 tk.). Jos esimerkiksi kielentutkija ryhtyy dualistiksi ja päättää, että 
äännökset ovat fysikaalisia ja kielen normit vuorostaan ei-fysikaalisia ja 
kummatkin ovat siten eri substanssia, tulee hänen vastata ainakin seu- 
raaviin kysymyksiin: Miten normi on olemassa? Miten ei-fysikaalinen ja 
fysikaalinen vaikuttavat toisiinsa? Onko fysikaalisella maailmalla ja sillä 
(idea) maailmalla, jossa normi sijaitsee, sama tieto-oppi? 

Dualistit ja pluralistit käyttävät usein termiä emergenssi, kun he pu- 
huvat uusien ilmiöiden kehittymisestä. Esimerkiksi emergenttisessä 
materialismissa (ks. Niiniluoto 1990; Määttä 2000) mentaalisten ilmiöi- 
den ajatellaan kehkeytyvän fysikaalisten lakien materiaaliselta alustalta. 
Mentaalinen ilmiö on tämän käsityksen mukaan osiinsa palautumaton. 
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Dualistin ja pluralistin on myés ratkaistava, johtavatko uudet substanssit 
episteemiseen pluralismiin, eli koskeeko jokaista erilaista substanssia 
sama vai eri tietoteoria. 


Emergenssi 


Termi emergenssi tulee latinan sanasta emergere 'nousta, tulla esiin, syn- 
tyä’. Metafysiikassa termiä käytti G. H. Lewes teoksessaan Problems of 
Life and Mind (1875) tehdessään jaon uusiin emergenttisiin ilmiöihin ja 
niitä edeltäviin ilmiöihin. Kuten muutkin tieteelliset termit emergenssi- 
termi saa tarkan käyttömerkityksensä vasta taustateoriassaan: useita 
erilaisia toisistaan eriäviä emergenssi-käsitteitä on nykyään käytössä eri 
teorioissa. Käsitykset voidaan jakaa heikkoon ja vahvaan emergenssiin, 
joiden välinen ero selitetään usein Pierre-Simon Laplacen (1951 [1814]) 
kaikkitietävän demonin avulla. 

Laplacen demoni tuntee kaikki universumin lait, tosiseikat, tulevat 
ja menneet tapahtumat atomin tarkkuudella. Heikko emergenssi viittaa 
johonkin sellaiseen kompleksisen systeemin uuteen ominaisuuteen, joka 
on sen systeemisen toiminnan tulos ja jonka kaikkitietävä demoni voi 
selittää ilmiön systeemisen toiminnan osilla ja summilla. Heikko emer- 
genssi viittaa siis uuteen systeemin aiheuttamaan yllättävään ilmiöön, 
joka periaatteessa kuitenkin voitaisiin selittää tieteessä, jos tutkijoilla 
olisi demonin tiedot maailmankaikkeudesta. 

Vahva emergenssi vuorostaan on uusi ominaisuus, jota koskevat to- 
tuudet eivät seuraa sen osatekijöistä tai historiaa koskevista totuuksista. 
Vaikka kaikkitietävä demoni tuntisi kaikki ilmiön aiheuttaneet alkutekijät, 
luonnon ja ihmisten aiheuttamien kompleksisten systeemien toiminnot, 
eivät uutta ominaisuutta koskevat todet lauseet olisi päätelmiä tästä tie- 
dosta. Ilmiö on siis aidosti uusi jollakin sellaisella tavalla, joka on onto- 
logisesti palautumaton alkutekijöihinsä tai osiinsa. 
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Emergenttiselle näkemykselle vastakkainen käsitys eliminatiivinen ma- 
terialismi on saanut paljon vaikutteita myöhemmästä Wittgensteinista. 
Esimerkiksi Dennett (1999) esittää, että mystiset subjektiiviset koke- 
mukset eli kvaliat eivät ole todellisia. Kvaliat, kuten kipu tai punainen, 
ovat merkityksellisiä subjektin tietoisuuden tai kokemuksen näkö- 
kulmasta, mutta ne saavat tämän merkityksen julkisessa jaetussa kieli- 
pelissä. Kvalioissa ja ensimmäisen persoonan perspektiivissä, jota myös 
kutsutaan tietoisuudeksi, ei siis Dennettin mielestä ole mitään sellaista 
ymmärryksen ylittävää uusien ilmiöiden emergoitumista, jota ei voisi 
tieteessä selittää. Tämä tarkoittaa, että Dennettin (mt.) mukaan kielen 
normissakaan ei ole mitään sellaista, mitä ei voisi selittää ainoastaan 
materiasta koostuvan maailmankäsityksen kehyksessä: linnun viserryk- 
sessä on säveliä, ja ihmisen puheessa on tavuja. 

Sellaiset kielentutkimuksessa käytetyt oleelliset termit kuin normi, 
laki, universaali tai merkitys viittaavat johonkin ei-havaittavaan (laista ks. 
myös Johdannon luku 3 tk.). Fi-havaittava ei tarkoita kuitenkaan loo- 
gisesti, että jotakin uutta substanssia on välttämättä ”emergoitunut” 


reaalitodellisuudessa. Standardikäsityksen mukaan tieteellisen teo- 
rian käsitejärjestelmän ”yläpäässä” on abstrakteja käsitteitä, joilla ei 
ole havainnossa suoria vastineita. Esimerkiksi substantiivi tai merkitys 
ovat sellaisia abstrakteja käsitteitä, joita voi selittää vain toisten käsittei- 
den avulla, ei yksinomaan osoittamalla jotakin reaalista oliota. Teorian 
käsitejärjestelmän ”alapäässä” on vuorostaan havaintotermejä, joiden 
avulla teoria tarrautuu kiinni todellisuuteen. Havaintotermejä ovat 
esimerkiksi lehmä, glottaaliklusiili tai pistävä. Niiden avulla kerrotaan, 
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miten teoriassa olevista ilmiöistä voidaan tehdä havaintoja. Havainto- 
termit eivät kuitenkaan ole teoriavapaita, vaan nekin saavat määritel- 
mänsä taustakäsitejärjestelmässä ja ovat siten teoriapitoisia. Fsimerkiksi 
mikä tahansa kurkun kakistelu ei ole glottaaliklusiili, jos se ei ole osa 
tietynlaista kielellistä ilmausta ja osa kyseisen kielen äännejärjestelmää. 
Havaintotermi ei myöskään tarkoita, että havainnon pitäisi olla ilmi- 
selvä nimenomaan ihmisen aistijärjestelmälle. Niin neurolingvistiikka 
kuin hiukkasfysiikkakin tekevät havainto-oletuksia, mutta mikrotasoa 
kuvaavia ilmiöitä voidaan havaita ainoastaan tutkimusteknologian eli 
erilaisten laitteiden avulla. 

Kielentutkimuksen teoria usein nivoo kieli-käsitteen johonkin pe- 
rimmäiseen ilmiöön eli metafysiikkaan. Chomskylle kieli perimmäi- 
senä ilmiönä palautuu biologiaan (genetiikkaan). Siksi siinä on jota- 
kin universaalia, jonka voi tavoittaa formaalisten järjestelmien avulla. 
Lakoff ja Johnson (1999) vuorostaan esittävät ajatuksen, että kieli on 
pääasiassa ”ruumiillista kognitiota” (engl. embodied cognition), joka laji- 
valinnan tuloksena on kehittynyt jäsentämään maailmaa kolmiulottei- 
sen realistisesti ja aikapaikkaisen jäsentyneesti. Kielen tutkimus on siksi 
heidän mukaansa kognitiivisten ja ruumiillisten käsitteiden tutkimus- 
ta. Funktionalistiset teoriat vuorostaan korostavat kieltä sosiaalisena 
aktiviteettina tai toimintaa tuottavana prosessina. Croft (2000) kuvaa 
kieltä populaatioksi ilmauksia, joita tulee ajatella samalla tavoin kuin 
ihmispopulaation ilmiyksiköitä: ilmausten alla on lingueme-rakenne, 
”kielen DNA”. Kielissä on siksi Croftin (mt.) mukaan sekä universaaleja 
piirteitä että suurta variaatiota hyvin samantyyppisesti kuin biologisissa 
järjestelmissä. 

Kielentutkimuksessa metodin taustateoriat vastaavat siis usein sekä 
onttiseen että metafyysiseen kysymykseen (ks. Johdannon luku 3 tk.). 
Teoriat kielestä ilmaisevat eksistenssioletuksia, jolloin ne samalla ilmai- 


sevat käsityksen kielen ja maailman luonteesta tavalla, jolla on onto- 
logisia implikaatioita. Ilman tällaisia tutkimuskohteen olemassaoloa 
koskevia oletuksia tieteellisen metodin käyttöä ei voi perustella. 
Kielentutkimuksessa tutkimuskohteen määritelmään liittyvä si- 
toumus sitoo tutkimuksen kauttaaltaan samanaikaisesti semanttiseen, 
ontologiseen ja metodologiseen teoriaan. Esimerkiksi sellainen käsitys, 
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että maailmassa on olemassa universaalia sinisyyttä tai että kieliopissa 
on ihmisestä riippumattomia ideoita eli universaaleja, on käsiterealis- 
mia. Päinvastainen käsitys puolestaan on nominalismia. Nominalistit 
siis kieltävät käsiterealismin eli sen ajatuksen, että yleiskäsitteet ovat 
olemassa perustavalla tavalla ihmisestä riippumattomina erillisinä 
olioina. Nominalistin mukaan universaaleilla ei ole vastaavuutta kielen 
ulkopuolisessa maailmassa. Väite, että jokin on sininen, kuvastaa no- 
minalistin mielestä ainoastaan kielen käyttöä. Sininen on pelkkä nimi, 
jonka kieliyhteisö on antanut yhteiselle tavalle nähdä esimerkiksi meren 
tai taivaan heijastamat valon aallonpituudet. Nominalismi johtaa usein 
metodologiseen instrumentalismiin: tieteen teoreettiset termit ovat 
pelkkiä instrumentteja, joiden avulla tehdään ennustuksia, havaitaan ja 
systematisoidaan. 

Tutkijan käsitys tutkimuskohdetta luokittavista käsitteistä sitoo hä- 
net siis johonkin ontologiseen kokonaisnäkemykseen. Jos esimerkiksi 
kielentutkija ajattelee, että termi genetiivi on tutkijan työkalu mutta että 
todellisuudessa ei sinänsä ole olemassa erillistä oliota tai kategoriaa ”ge- 
netiivi”, hän saattaa olla nominalisti ja metodologinen instrumentalisti. 
Jos kielentutkija vuorostaan tunnustautuu käsiterealistiksi, hän uskoo, 
että termi genetiivi kuvaa jotakin luonnollista kielellistä luokkaa, joka on 
olemassa reaalimaailmassa silloinkin, kun kukaan ei ole sitä luokitta- 
massa. Konseptualismi on realismin ja nominalismin välissä oleva kan- 
ta, joka olettaa, että yläkäsitteet ovat ihmisten mielessä. Konseptualistin 
mukaan havainto maailmasta on käsitteellistämistä. Maailma ei konsep- 
tualismin mukaan ole erillinen käsitejärjestelmästämme vaan osa sitä. 
Jotta mitään voisi sanoa miksikään, esimerkiksi genetiiviksi, ihmisen 
on ensin käsitteellistettävä havaintonsa. Käsitteitä on siten ainoastaan 
ihmismielessä, ja siksi konseptualistin mukaan on mieletöntä kysyä 
mitään maailman käsitteellisestä rakenteesta. Mielekkäitä ovat vain ne 
kysymykset, jotka kysyvät, miten käsitteellistämme maailmaa. 

Konventionalistit taas ajattelevat, että kielet, tieteelliset teoriat ja 
yläkäsitteet ovat sopimuksia. Monet nykysuuntaukset, jotka edustavat 
ontologista pluralismia tai käsitystä, että maailman kuvaamisen kieliä 
on useita, perustavat käsityksensä Carnapin (1934) konventionalismiin. 
Carnapin (mt.) mukaan todellisuuden luonnetta koskevat kysymykset 
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riippuvat kielen rakenteesta. Kielen merkitykset ovat sopimuksen- 
varaisia. Carnapia seuraavan saksalaisen nykyfilosofin Markus Gabrie- 
lin (2015) mukaan voimme eri kielissä kuvata yhden reaalimaailman 
sijaan useita erilaisia merkityskenttiä. Merkityskenttä tarkoittaa sitä, että 
kvantteja on olemassa David Deutschin kvanttifysiikan teoriassa, noitia 
on olemassa Grimmin saduissa, skeemoja on olemassa kognitiivisessa 
kieliopissa jne. Kun muut metafysiikan teoriat määrittävät kysymyksen 
eksistenssistä kielen ja reaalimaailman väliseksi kysymykseksi, konven- 
tionalisti sijoittaa sen tekstin tai kontekstin sisäiseksi kysymykseksi. 

Suomessa varsin paljon huomiota saaneen, Niiniluodon (1999) ke- 
hittämän kriittisen realismin näkemys on vuorostaan se, että todellisuu- 
dessa on käsitteellistämisestä ja kielestä riippumattomia piirteitä, joista 
voimme saada tietoa vain epäsuorin keinoin selvittämällä asioita par- 
haamme mukaan tieteen tai muun tietämisen tavan kautta. Yläkäsitteet 
viittaavat todellisuuteen. Niiniluoto puolustaa käsitystä, että tieteellisen 
teorian teoreettiset käsitteet, kuten atomi tai genetiivi, kuvaavat jotakin 
reaalitodellisuudessa. Se että teorioita voi testata todellisuuden ja aineis- 
tojen valossa, osoittaa tieteellisen realistin mukaan sen, että teoreettiset 
käsitteet eivät ole pelkästään instrumentaalisia. Myös Lakoff ja Johnson 
(1999) pitävät omaa merkitysteoriaansa realistisena, eli todellisuudes- 
sa todella on prototyyppejä ja metaforia, niin kielessä kuin ihmisen 
mielessäkin. 

1900-luvulla tieteenfilosofiassa pohdittiin laajasti sitä, onko tieteel- 
lisen teorian abstrakteilla eli ei-havaittavilla käsitteillä vastinetta eli 
referenttiä todellisuudessa. 1900-lukua voidaankin kutsua teoreetikon 
dilemman (Hempel 1958) vuosisadaksi.? Debattia seurannut nykykäsitys 
on, että kaikki termit ovat teoriapitoisia eli termit sisältävät merkitys- 
rakenteita taustateoriastaan (Tuomela 1973). Tämä tarkoittaa sitä, että 
havaintotermin ja abstraktin termin välillä ei ole dikotomista eroa. Nii- 
den rakenne vain on erilainen. 

Edellä huomattiin, että käsitys siitä, mihin teoreettiset termit viittaa- 
vat, implikoi totuusteoriaa. Totuuden korrespondenssiteoria eli käsitys, 
että teoria kuvaa todellisuutta, on sovellettavissa ainoastaan realistisessa 
kehyksessä, joka hahmottaa kielestä riippumattoman maailman. Instru- 
mentalistin soveltamat totuuden koherenssiteoriat vuorostaan esittävät, 
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että koko käsite todellisuus on hylättävä, sillä meillä ei ole käsitteistä 
riippumatonta suhdetta todellisuuteen. Koherenssiteorioiden taustalla 
on käsitys kielen semantiikasta: kieli voi viitata vain muihin kielellisiin 
merkkeihin, ja merkitys muodostuu vain suhteessa kielelliseen konteks- 
tiin. Koherenssiteorioiden mukaan voidaan periaatteessa puhua vain eri- 
laisten todellisuutta kuvaavien teorioiden välillä esiintyvästä koherenssis- 
ta, ei ihmisestä riippumattomasta reaalitodellisuudesta itsestään. Mikäli 
jokin tieteellinen väite on ristiriidassa hyväksyttyjen muiden tieteellisten 
väitteiden kanssa, sitä ei hyväksytä tieteelliseksi tiedoksi. Mikäli väittei- 
den ja teorioiden välillä on suuri koherenssi, voidaan puhua tieteelli- 
sen tiedon karttumisesta. Konsensusteorioiden mukaan ei voida puhua 
edes koherenssista, sillä viime kädessä tiedeyhteisö on se, joka päättää 
siitä, mikä on mielekäs tieteellinen lause ja mikä ei. Näin ollen tulisi 
puhua vain siitä, mitä tiedeyhteisö subjektina päättää uskoa todeksi. 
Konsensusteorioita motivoi näkemys, että kielelliset merkitysjärjestelmät 
ovat mielivaltaisia, kulttuurikohtaisia ja satunnaisia. Instrumentalismin 
ja realismin sekä koherenssi- ja korrespondenssiteorioiden välistä jänni- 
tettä ilmaistaan myös termien konstruktivismi ja fundamentalismi avulla. 
Fundamentalismi on realistisiin käsityksiin liittyvä ajatus siitä, että tieto 
on perustavanlaatuista ja liittyy maailmaan, kun taas konstruktivismin 
teoriat yleensä esittävät, että tieto on ihmisen rakentamaa, konstruoitua. 


Totuusteorioiden taustalla on erilainen käsitys semantiikasta: 


e Realistiset teoriat olettavat, että kieli viittaa johonkin todelliseen 
maailmassa. Siksi käytössä on usein jonkinlainen totuuden korres- 
pondenssiteoria. 

e Instrumentalistiset teoriat vuorostaan olettavat, että kieli on 
sopimuksenvaraista. Käytössä on siksi jokin totuuden koherenssi- tai 
konsensusteoria. 


Viime vuosisadalla keskustelua käytiin kielen ja sen referenttien eli sen 
ilmitodellisuudesta poimimien tarkoitteiden suhteesta. Nykydebatin 
kohteena on havaintokielen ja tieteen kielen välinen ero. Tämä dilemma 
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voidaan kiteyttää kysymykseen siitä, onko havaittuja ilmiöitä lainkaan 
olemassa. 2000-luvun metafyysistä keskustelua voidaan siksi kutsua 
havaitsijan dilemmaksi. Thomassonin (2007) mukaan nykytutkimukses- 
sa on enemmän sellaisia koulukuntia, jotka esittävät, että mitään ei ole 
olemassa havaitsijasta riippumatta. Nämä koulukunnat kieltävät jopa 
tavallisten arkipäivän olioiden olemassaolon: pöytiä tai Matteja ei ole 
olemassa. Tähän nihilistiseen tai eliminativistiseen suuntaukseen on 
syynä tieteellisen maailmankuvan muutos. Ongelmaksi hahmottuu se, 
että tieteellisen maailmankuvan ja havaintomaailman välissä näyttää 
olevan ylittämätön kuilu. Tieteen kuvaama fysikaalinen todellisuus ja 
ihmisen havaitsema todellisuus tuntuvat kuvaavan hyvinkin erilaisia 
asioita: kuvauksissa ei ole käytössä mitään yhteisiä termejä. 

Quinen (1948) tavoite tunnetussa kirjoituksessaan ”On what there 
is?” oli onttisen kysymyksen muotoa jäsentämällä pyrkiä siihen, että 
ontologia toimisi rakentavana osana tieteellistä teoriaa ja tieteellistä tut- 
kimusta. Paradoksaalisesti juuri tämä näkemys ontologiasta osana tie- 
teellistä teoriaa on aiheuttanut tutkimussuunnan, jossa on yllättävän vai- 
kea perustella arkihavaintomme olioiden olemassaoloa (ks. Thomasson 
2007). Jos hyväksymme tieteellisen maailmankuvan esittämän todelli- 
suuden ja sen, että se on jollakin tapaa todempi kuin aistihavaintomme, 
silloin tämä johtaa kysymykseen, mitä aistienvarainen arkihavainto sit- 
ten ilmaisee. Tämän kysymyksen voi sopeuttaa kielentutkimukseen seu- 
raavassa muodossa: jos kielentutkimus tavoittaa todellisemman kuvan 
kielestä kuin arkihavainto, mitä arkihavainto kielestä sitten ilmentää? Se 
että esimerkiksi kuulee selvästi toisen ihmisen puhuvan ja jopa havait- 
see puheessa erilaisia sijamuotoja, ei tämänhetkisen metafysiikan alan 
tutkimuksen mukaan ollenkaan todista, että kieltä on olemassa. 

Metafysiikan nihilistinen suuntaus on johtanut viime vuosi- 
kymmeninä lisääntyvään määrään metametafysiikan koulukuntia, 
joissa on alettu tutkia ontologian ja metafysiikan alan tutkimuskäsit- 
teistöä (ks. Chalmers, Manley & Wasserman 2009). Realismia eli sitä 
käsitystä, että on olemassa jotakin mielestä riippumatta, puolustetaan 
siksi 2000-luvulla hyvin usein antirealististen metaontologisten ja ni- 
hilististen metametafyysisten käsitysten kautta. Nämä metametaposi- 
tiot kieltävät tai kyseenalaistavat osan ontologisesta tutkimuksesta tai 
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kaiken sitä koskevan tutkimuksen. Ontologisen ja metaontologisen tut- 
kimuksen tasojen välistä eroa voi kuvata seuraavasti: Ontologi kysyy, 
onko maailmassa kieltä, johon idealisti vastaa ”kyllä” ja nominalisti "ei". 
Metaontologiassa taas kysytään, onko olemassa sellaista objektiivista 
näkökulmaa kieleen, jonka avulla saisimme selville, onko maailmas- 
sa olemassa kieltä. Metaontologinen realisti vastaa tähän kysymykseen 
"kyllà" ja metaontologinen antirealisti "ei" (ks. Chalmers 1996). Viime 
vuosisadalla kielentutkija on voinut vedota sellaisiin filosofisiin aukto- 
riteetteihin kuin Wittgensteiniin, Ouineen tai Chomskyyn valitessaan 
metodin sillä perusteella, että uskoo kielen olevan jotakin erityistä subs- 
tanssia tai vastustaa jotakin toista koulukuntaa, koska pitää sen käsitystä 
kielen ”todellisesta luonteesta” virheellisenä. 2000-luvulla kielentutkijan 
filosofinen konteksti on hyvin toisenlainen. Kielifilosofiankin perusta on 
hieman horjunut, koska metafysiikan tutkimus on hajonnut kahteen 
kenttään. 

Olipa tutkijan ontologinen sitoumus mikä tahansa, tutkijan tieteelli- 
sen teorian käsitejärjestelmän tulee olla joka tapauksessa sisäisesti ko- 
herentti. Koherentissa ja loogisessa tieteellisessä teoriassa väitelauseiden 
tulee säilyttää onttiset, metafyysiset ja kategorioita koskevat oletukset. 
Tämä tarkoittaa seuraavaa: 


1. Vastaus onttiseen kysymykseen (Mitä olioita maailmassa on?) on 
teoriassa koherentti ja looginen. 

2. Vastaus metafyysiseen kysymykseen (Mistä maailma on tehty?) on 
koherentti ja pysyy tutkimuksen kuluessa vakiona. Suhtautumis- 
ta tai asemoitumista eri näkökantojen, esimerkiksi monismin tai 
pluralismin välillä, ei vaihdella. 

3. Käsitejärjestelmä on sisäisesti koherentti: ei esimerkiksi käytetä 
emergenttistä terminologiaa, jos on sitouduttu eliminatiiviseen 
materialismiin. 

4. Kategoriaoletukset pysyvät samoina teoriassa. Tämä tarkoittaa, että 
käsitteiden intensio ja ekstensio pysyvät teoriassa muuttumattomi- 
na. Tämä tarkoittaa myös sitä, että alakäsitteiden määritelmien ja 
yläkäsitteiden välillä on merkityskoherenssi: yläkäsitteen intensio 
on osa alakäsitteen määritelmää. 
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Edellä on tutkittu sitä, miten kielitieteessä tutkimuskohteen eli kielen 
määritelmä vaikuttaa niin metodologiaan kuin tieto-oppiin ja totuus- 
teoriaan. Huomattiin, että käsitys semantiikasta implikoi oletuksia 
kielen ja maailman suhteesta ja siten viime kädessä määrittää totuus- 
teoreettiset oletukset. Tämä suhde näkyy kuviossa 10. 


1. Uskomuksen muodostamisen tapoja 


2. Tieteellisten perustelujen muodostamisen tapoja 


formaalitieteet reaalitieteet 


3. Kielen ontologinen taustateoria 


totuusteoriat 


Kuvio 10. Kielen oletettu ontologia implikoi totuusteoriaa. 


2.5. Metodologiset ehdot 


Edellisessä luvussa on tarkasteltu sitä, millä tavoin tieteellinen tutkimus 
perustuu käsityksiin tutkimuskohteesta ja siihen, miten kohteesta saa- 
daan tietoa. Tässä luvussa tarkastellaan sitä, millaisia erilaisia vastauksia 
metodologisiin kysymyksiin on annettu ja millä tavoin annetut vastauk- 
set ovat ajan myötä kehittyneet. Tieteellistä prosessia pohtineet tieteen- 
filosofit ovat perustaneet käsityksensä oikeasta metodologisesta ehdosta 
tai periaatteesta esimerkiksi näkemyksiin siitä, että tieteen päämääränä 
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on yhtenäinen maailmankuva tai että jokin tietty selitysmalli on ainoa 
oikea tieteellisen selityksen rakenne. Oheiseen tietolaatikkoon on kitey- 
tetty niitä kysymyksiä, jotka ovat tieteenfilosofien päättelyssä johtaneet 
asettamaan tietyn metodologisen ehdon tieteelliselle tutkimukselle. 


Metodologisia kysymyksiä 


e Onko tieteellä yksi yhteinen päämäärä? 

e Onko tieteellä jokin yksi (tai useampi) yhteinen piirre? 

e Liittyvätkö tieteelliset tiedot toisiinsa muodostaen yhden yhtenäisen 
kuvan todellisuudesta? 

e Onko tiede objektiivista vai arvolatautunutta? 

e Millaisia selityksiä ja kuvauksia tieteessä hyväksytään? 

e Ovatko termit, teoriat tai tutkimusalat palautettavissa toisiinsa? 


Metodologinen optimisti Francis Bacon (1561-1626) uskoi (1620), 
että hän oli kehittänyt vedenpitävän induktiivisen tekniikan, jota voi- 
si soveltaa mekaanisesti ilmiöön kuin ilmiöön, jolloin tuloksena olisi 
tieteellisiä totuuksia. David Hume (1711-1776) huomasi (2016 [1748]) 
kuitenkin, että Baconin ehdottaman induktivismin ongelma on se, että 
emme koskaan voi tyhjentävästi havainnoida kaikkia yksittäistapauksia: 
jossain on voinut olla joskus musta joutsen, joka kieltää lauseen ” (kaik- 
ki) joutsenet ovat valkoisia”.$ Toisekseen lakia ei voi johtaa yksittäisistä 
ilmiöistä. Baconin induktivistinen teoria ei siis ollut sellainen tieteelli- 
nen prosessointilaite, jonka yhteen päähän saattoi työntää havaintoja ja 
toisesta päästä tuli ulos luonnonlakeja. 


Naiivi ja kehittynyt induktivismi 


Naiivin induktivismin mukaan tutkimus etenee havainnoista yleistyksiin, 
joita sitten testataan uusien havaintojen avulla. Naiivi induktivismi on 
ankaraa empirismiä, sillä se esittää, että havainto on riittävä tiedon läh- 
de ja tarjoaa varman perustan. 
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Kehittyneen induktivismin mukaan tutkija määrittelee tutkimus- 
ongelman ja aineiston tarpeeksi suppeaksi siten, että kysymykseen saa- 
daan vastaus yhdessä tutkimuksessa. Tutkimuksessa ei pyritä yleisiin 
lakeihin vaan tiettyä populaatiota tai aineistoa koskevaan rajoitettuun 
yleistykseen. 


Aiheesta lisää: 


Hacking, lan. 2001. An Introduction to Probability and Inductive Logic. 
Cambridge: Cambridge University Press. 


Auguste Comten (1798-1857) mukaan Baconin ja Humen analyyttiset 
ajatukset tieteestä järjestelmällisenä metodina heijastivat ihmiskunnan 
ajattelussa tapahtunutta positiivista edistystä. Tätä edistystä hän kuvasi 
kolmen vaiheen kautta: 


1) Ensimmäisenä oli teologinen vaihe, jossa luonnonilmiöt ymmär- 
rettiin yliluonnollisten olioiden aiheuttamiksi. 

2) Metafyysisessä vaiheessa ihmiskunta alkoi käyttää abstrakteja 
käsitteitä. 

3) Positiivisessa vaiheessa ihmiskunta ymmärsi, että tietoa voi saada 
vain havaittavista tosiasioista. 


Positivismi tarkoitti Comtelle positiivista asennetta tieteeseen yhteis- 
kunnassa, ja hän toivoi, että esimerkiksi päättäjät perustaisivat päätök- 
sensä uskonnon sijaan tieteelliseen tietoon. Valistusajan positivismi 
oli maltillista empirismiä ja tieteellistä optimismia, ja se eroaa sitä 
seuranneesta ankaran reduktiivisesta 1900-luvun alun loogisesta po- 
sitivismista eli loogisesta empirismistä. Kumpaakin tieteenfilosofista 
koulukuntaa kuitenkin yhdistää ajatus, että tieteellä on yksi yhtenäi- 
nen kriteeri ja tieteellinen tieto yhdistyy yhtenäiseksi tieteelliseksi 
maailmakuvaksi kaikesta olevasta. Kumpikin positivismi oli siis mo- 
nistinen näkökanta. Metodologiselle monismille on tyypillistä olettaa, 
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että tieteellä on jokin yksi yhdistävä piirre tai ehto ja että viime kädessä 
kaikki tieteellinen tieto antautuu yhdeksi yhtenäiseksi maailmankuvaksi 
ihmisen ymmärrykselle. 

Looginen empirismi, joka tunnetaan myös Wienin piirinä, oli hyvin 
lyhytkestoinen koulukunta 1920-luvulla ennen toista maailmansotaa. 
Sen vaikutus tieteenfilosofiaan on kuitenkin ollut huomattava, sillä sii- 
hen kuului suuri osa tuon ajan merkittävimmistä filosofeista: Rudolf 
Carnap, Kurt Gödel, Otto Neurath, Moritz Schlick, Philipp Frank, Karl 
Menger ja Hans Hahn. Useat filosofit, kuten suomalainen Fino Kaila, 
assosioituivat piiriin välillisesti. Sodan alkaessa usea piirin jäsen pakeni 
Yhdysvaltoihin, mikä johti siihen, että piirin ajatuksia alettiin ilmaista 
englanniksi ja ne levisivät laajemman yleisön tietoisuuteen. Piirin roo- 
li tieteenfilosofiassa ja maininta tässäkin yhteydessä ei perustu siihen, 
että se olisi esittänyt oikeaksi oletetun käsityksen tieteestä — päinvastoin. 
Kun viimeiseltä loogiseksi empiristiksi tunnustautuneelta Alfred Ayerilta 
kysyttiin 1970-luvulla, mikä kovasti haukutussa loogisessa empirismis- 
sä oli niin väärää, hän vastasi, että suuntauksen kaikki premissit olivat 
virheellisiä. Koulukunnan ääriempiristiset ajatukset toimivatkin erään- 
laisena ponnahduslautana toisenlaiseen ajatteluun. Liikkeen esittämien 
ajatusten vastustaminen muodostaa keskeisellä tavalla 1900-luvun 
tieteenfilosofisen kirjallisuuden punaisen langan (ks. Raatikainen 2004). 

Loogiset empiristit olivat esimerkiksi vaatineet, että teoreettiset ter- 
mit on palautettava havaintokieleen ja että jos käsitettä ei voisi kääntää 
välittömästi havaittavaan, se olisi hylättävä. Tätä kutsuttiin käännettävyys- 
teesiksi. Tätä ja muita koulukunnan esittämiä teesejä tutkittiin laajalti so- 
tien välisessä ja vielä sen jälkeisessä tieteenfilosofiassa. Yksi toisensa jäl- 
keen ne osoittautuivat mahdottomiksi. Tieteellistä teoriaa ei voi pelkistää 
havaintoon. Nykytutkimuksessa tämä tarkoittaa sitä, että termi empiiri- 
nen ei ole käytössä enää tässä reduktiivisessa merkityksessä: empiiri- 
nen ei siis tarkoita, että kaikki abstrakti olisi palautettava havaittavaan. 
Empiirisellä näytöllä tarkoitetaan nykyään yleensä laajemmin kaikkea 
sellaista ensi käden informaatiota, joka voi antaa tukea jollekin väitteel- 
le tai kieltää sen. Siten esimerkiksi keskustelunanalyysin data, erilai- 
set tekstit, korpukset tai kyselyt voidaan käsittää empiiriseksi todistus- 
aineistoksi. (Termin empiria käytöstä kielitieteessä ks. Konstenius 2014.) 
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Loogisen empirismin eräs versio, operationalismi, vaati, että termit 
käännetään mittausformuloiksi. Sekään ei lopulta kantanut kovin pitkäl- 
le: eri mittareilla saadut tulokset eivät terveen järjen mukaan kerro eri 
olioista. Hiekkakello, digitaalinen kello ja mekaaninen kello eivät viittaa 
eri aikoihin. Operationalisoinnilla tarkoitetaan nykyään yleensä vain sitä, 
että yksityiskohtaisesta teoreettisesta termistä muodostetaan pelkiste- 
tympi testattava määritelmä empiiriseen tutkimukseen. Esimerkiksi 
Eleanor Roschin (1973) termi prototyyppi voidaan määritellä kyselyä var- 
ten ”kategorian parhaaksi esimerkiksi”, jolloin vastaajilta kysytään heidän 
käsityksiään esimerkiksi värien, huonekalujen tai pelien edustavimmista 
esimerkeistä. Käsite prototyyppi ei ole synonyyminen hyvän esimerkin 
kanssa, mutta tutkimusasetelmaa varten tällainen köyhä operationaali- 
nen määritelmä on välttämätön. 

Loogisen empirismin verifikationismi eli ajatus siitä, että tieteelli- 
set termit yksinkertaisesti todennetaan kokemuksen, havaintotermien 
tai operationaalisten määritelmien avulla, hylättiin myös. Karl Popper 
(2002 [1934]) esitti sen vastapainoksi falsifikationismin, vaatimuksen 
siitä, että tieteellisen teorian tulee tehdä sellaisia havaintomaailmaa 
koskevia ennustuksia, joiden perusteella voidaan päätellä, onko teoria 
tosi vai ei. Ennusteiden tulisi lisäksi olla sellaisia, että ne voidaan kään- 
tää kieltolauseiksi, sillä tämä kieltolauseiden joukko kertoo, missä olo- 
suhteissa teoria ei ole tosi, eli mikä teorian falsifioi (Popper 2002 [1934], 
95).° Nykyään ajatellaan, että tutkimuksessa voidaan saavuttaa hypotee- 
sia tukevaa evidenssiä tai falsifioida osia teoriasta. Koko taustateoriaa ei 
yleensä voi kaataa yhden tutkimuksen tuloksin. 

Tieteelliset teoriat ovat oman aikansa käsitejärjestelmän osia, ja 
näitä käsitejärjestelmiä parannetaan vain niiltä osin, kuin ne osoittau- 
tuvat puutteellisiksi. Niitä ei hylätä ennen kuin jokin kilpaileva teoria 
on osoittautunut selvästi kokonaisvaltaisesti kelvollisemmaksi. Naiivi 
falsifikationismi on nimensä mukaisesti yksinkertainen mutta myös 
väärä tulkinta Popperin tieteenfilosofiasta. Se esittää virheellisesti, 
että jokainen tieteellinen teoria on operationalisoitava kokeelliseen 
tutkimusasetelmaan (Kitcher 1983, 44). Jos näin todella olisi, Einsteinin 
suhteellisuusteoria tai muut teoreettiset tietojäsennykset eivät olisi tie- 
teessä luvallisia (Couvalis 1997, 69-71). 
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Nykyään myös Popperin falsifikationismia pidetään liian ankara- 
na, sillä se johtaa siihen, ettei tieteessä voi hyväksyä rajoittamattomia 
eksistenssilauseita, esimerkiksi ”on olemassa joutsenia” (ks. Niiniluoto 
1980b). Vuosisadan puolivaiheessa positivismin korvasi instrumenta- 
lismi eli käsitys siitä, että teoreettisilla termeillä oli käyttöä teorioissa. 
Instrumentalismin mukaan teoreettiset termit, kuten elektroni (fysiikas- 
sa) tai särkyvä (kryptografiassa tiedon piilottamisesta), ovat hyödyllisiä, 
mutta ne eivät viittaa mihinkään todelliseen. 


Naiivi ja kehittynyt falsifikationismi 


Naiivin falsifikationismin mukaan tutkimuksessa falsifioidaan eli pyri- 
tään kumoamaan lauseita eli hypoteeseja. 


Premissi: Jos hypoteesi H on tosi, niin silloin saamme havaintotuloksen 
h. 


Falsifikaatio: Havaintotulosta h ei esiinny. 


Päätelmä: Hypoteesi H ei ole tosi. 


Kehittyneessä falsifikationismissa koetellaan teorioita, jotka voivat saa- 
da vain osittaista konfirmaatiota tai vastaevidenssiä. Tutkimusasetelma 
tulisi rakentaa siten, että saadaan mahdollisimman suuri mahdollisuus 
vasta-argumentille. 


Postpositivismin kehitykseen on vaikuttanut pitkälti Sellarsin (1963) 
huomio, että havainto ei ole puhdasta. Nykypsykologia on tukenut tätä 
käsitystä, ja se on osoittanut kiistatta, että havaitseminen on teoria- 
pitoista, Wittgensteinia (2009 [1953]) mukaillen ”näkemistä jonakin”. Fi 
siis ole olemassa käsitteistä vapaata puhdasta havaintoa todellisuudesta 
siinä mielessä kuin positivistit olettivat. Tämä tarkoittaa sitä, että ero teo- 
reettisen ja empiirisen tutkimuksen välillä on kaventunut ja hämärtynyt. 

Loogisen empirismin jälkeen alettiin keskustella erityisesti Hempelin 
ja Oppenheimin (1948) deduktiivis-nomologisesta mallista (DN-malli), 
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joka on yksi versio John Stuart Millin (1806-1873) esittämästä peittävän 
lain mallista eli subsumptioteoriasta (1906 [1875]). Subsumptioteoria on 
tieteellisen selittämisen malli, joka vastaa kysymykseen, miksi ilmiö ta- 
pahtui. Mallissa selitettävä ilmiö seuraa yleisistä laeista ja alkuehdoista. 


Selitysongelma: Miksi järvi on jäätynyt? 
Yleinen laki: Vesi jäätyy o celsiusasteessa. 


Päätelmä: Järvi on vettä, ja ilman lämpötila on alle o celsiusastetta. 


Subsumptioteorian yksi ongelma on, että tieteellinen tieto ei aina ole 
selittävää. Osa tieteellisestä tiedosta on kuvailevaa, analyyttista, syste- 
matisoivaa ja syntetisoivaa. Esimerkiksi usein jonkin kielen referenssi- 
kielioppi on tiedollinen systematisaatio, ei selitys siitä, miksi kieli on 
sellainen kuin on. Tällainen kuvaileva, tulkitseva ja systematisoiva tut- 
kimus on kuitenkin oleellista perustutkimusta useimmilla tieteenaloilla. 
Subsumptioteorian tutkimus johti siis päätelmään, että tiede on moni- 
muotoisempaa kuin aikaisemmin oli luultu. Keskenään hyvinkin erilai- 
set tietoesitykset ovat tiedettä. 

Subsumptioteorian toinen ongelma oli myös käsitys kausaalisuudesta 
lainomaisena säännönmukaisuutena. Tämä kausaatio-käsitys on nyky- 
filosofian mukaan kestämätön, ja sen on korvannut käsitys kausaatiosta 
manipulaationa: A aiheuttaa B:n. Kausaation nykymääritelmään kuuluu 
myös usein kontrafaktuaalinen ehto: ilman B:tä ei tapahtuisi A:ta (ks. 
Raatikainen 2007). Kausaation määritelmällä on ollut suuri vaikutus sii- 
hen, miten sekä fysikaalisen maailman että sosiaalisen maailman suh- 
teita kuvataan ja voidaan ymmärtää. Kausaatio-käsitteen modernin mer- 
kityksen ymmärtäminen on myös oleellista kielen teoriassa: kausaatio 
ei siis tarkoita luonnonlain kuvaamista vaan aiheuttamisen kuvaamista. 

Nancy Cartwrightin (1983) mukaan subsumptioteorian sovelluksia, 
kuten sen modernimpia versioita Suppen (1974) probabilistista kau- 
saatiota, Salmonin (1971) tilastollista relevanssia tai Hanssonin (1974) 
kontekstuaalista mallia, vaivaa sisäänrakennettu illuusio luonnon lain- 
omaisuudesta. Todellisia kausaalisia luonnonlakeja on vain muutama, 
loput ovat niin sanottuja ceteris paribus -yleistyksiä. Ceteris paribus (lat.) 
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tarkoittaa muiden asioiden pysymistä muuttumattomina. Ilmausta käy- 
tetään tieteenfilosofiassa, kun halutaan viitata siihen, että jokin ulko- 
puolinen tekijä saattaa vaikuttaa kausaalisen prosessin lopputulokseen. 
Todellisuus on sotkuista, ja fysiikankin lait ovat ceteris paribus -ideali- 
saatioita, jotka kertovat, miten asiat olisivat, jos mikään muu seikka ei 
vaikuttaisi niihin. Cartwrightin (mt.) mukaan ei ole mitään periaatteel- 
lista syytä, miksi Jumala tai luonto ei olisi voinut tehdä vain muutaman 
lain ja rajoituksen ja sitten väsyä projektiinsa ja jättää todellisuuden pe- 
rimmäisiä suhteita sotkuisiksi. Ajatus siististä, yhdestä lainomaisesta 
yhtenäisestä matemaattisesta maailmasta, joka on kaikkien ilmiöiden 
taustalla, on liian idealistinen. Cartwrightin (mt.) mukaan - jos todella 
rohkenemme katsoa, mitä fysiikassa tehdään ja millaisia sen teoriat to- 
siasiassa ovat — fysiikan teoriat muistuttavat enemmän ihmistieteiden 
sotkuisia malleja, joiden käsitteet ja väitteet ovat usein keskenään risti- 
riidassa. Kielentutkimuksen tutkimuskäsitteistön vertaaminen johon- 
kin ideaalina pidettyyn luonnontieteeseen, jossa löydetään puhtaita 
luonnonlakeja, ei siis ole nykykäsityksen mukaan kovin mielekästä. 

Edellä olemme havainneet, että perimmäistä todellisuutta koskevat 
käsityksemme ohjaavat tieteen tekoa: Tuleeko tieteellisen tiedon yhdis- 
tyä yhdeksi yhtenäiseksi maailmankuvaksi? Onko maailma kausaali- 
sesti sotkuinen paikka? Cartwrightin (1983) mukaan luonnontieteen 
selitykset eivät ole sen lainomaisempia kuin ihmistieteenkään: kaikki 
selitykset tieteessä ovat ceteris paribus -selityksiä. Cartwrightin (mt.) kä- 
sitys tieteestä on siis monistinen mutta ei perustu tieteellisen tiedon 
yhdistämispyrkimykseen. 

Metodologinen monismi voi siten perustua keskenään hyvinkin erilai- 
siin argumentteihin: käsityksiin tieteen yhtenäisyydestä, tieteellisyyden 
kriteeriin, selityksien johonkin piirteeseen tai todellisuuden luonteeseen. 
Raatikainen (2007) on muiden ohella esittänyt käsityksen, että metodolo- 
gista monismia on mahdollista kannattaa ja esimerkiksi vaatia, että ihmis- 
tieteiden kontrafaktuaalisen kausaation käsitettä sovelletaan myös luon- 
nontieteisiin. Jo Kuhn (1971) kiinnitti huomiota siihen, että lainomaisen 
kausaation käsite oli häviämässä fysiikan teorioista (Loewer 2001). Jotkut 
fysiikan perusteita pohtivat nykyfilosofit ovatkin väittäneet, että lainomai- 
sen kausaation käsite ei ole ollenkaan sovellettavissa fundamentaaliseen 
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fysiikkaan (ks. Latham 1987; Redhead 1990; Field 2003; Hitchcock 2007; 
Elga 2007). Fysiikan kausaation käsite olisi siten enemmän ihmistietei- 
den kausaatio-käsitteen kaltainen kuin, mitä viime vuosisadalla oletettiin. 

Metodologiset dualistit, kuten Charles Taylor (1971), esittävät yleen- 
sä, että luonnontieteillä ja ihmistieteillä on erilaiset metodit; toinen on 
havainnoiva ja toinen on ymmärtävä eli hermeneuttinen. Ihmistieteitä 
erottaa se merkitys, jonka ihminen antaa ilmiöille ja joka sitten viime 
kädessä ohjaa hänen toimintaansa. Käsitys siitä, että ihmisen luoman 
maailman merkitysten tulkinta perustuu ymmärrykseen, on peräisin 
erityisesti Wilhelm Diltheyltä (1982 [1860]), ja ajatusta ovat kehittäneet 
edelleen Hans-Georg Gadamer (1976) ja Jiirgen Habermas (1968) kir- 
joituksissaan. Hermeneutiikka on viime aikoina saanut myös uusia 
tulkintoja ja sovelluksia uusissa tieteellisissä yhtymäkohdissa, kuten 
informaatiosysteemien ja digitaalisen humanismin risteyskohdissa 
(Scheuermann & Kroesze 2017) sekä ihmisten luomien merkitys- 
maailmojen, esimerkiksi virtuaalisten tilojen, ontologisten kielien ja 
informaatioekologian toimintojen, ymmärtämisessä. Hermeneutiikka 
käsitteenä on myös inkorporoitunut kognition ja kommunikaation ym- 
märtämiseen: neuraalihermeneutiikka (Friston & Frith 2015) on osa 
monia malleja, jotka selittävät sosiaalista kognitiota, ymmärtämistä ja 
yhteistoimintaa (Gallagher & Allen 2016). 

Myös dualistit voivat siis perustella näkemyksensä keskenään erilaisin 
argumentein. Esimerkiksi von Wright (1999 [1971]) on metodologinen 
dualisti, joka esittää, että ihmistieteissä ei voida puhua kausaatiosta sa- 
massa mielessä lainomaisena lakina kuin luonnontieteissä. Ihmisten 
kohdalla tulee käyttää teleologisia selityksiä: intentio, motivaatio tai 
uskomus selittää tapahtumia. Ajatus on johdettu Aristoteleen (1994) 
praktisesta syllogismista: A uskoo, että tekemällä B:n hän saavuttaa C:n. 

Ymmärtäminen inhimillisenä aktiviteettina implikoi jonkinlaisia ar- 
voja. Tämä tarkoittaa sitä, että hermeneuttinen traditio on ristiriidassa 
weberiläisen tiedekäsityksen kanssa. Max Weberin (1949) mukaan tiede 
ei voi kertoa meille, mihin ihmiskunnan tulisi pyrkiä, vaan ainoastaan, 
miten sinne pääsee. Weberiläinen tiedekäsitys erotti tieteen objektivis- 
min ja arvot. Hermeneutiikan isä Habermas (1970) vuorostaan esitti, 
että nämä ovat tieteessä saman kolikon kaksi puolta: ihmistieteet ovat 
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arvolatautuneita, mutta niin on muukin tiede. Habermasin mukaan 
näin välttämättä aina onkin: tiede on inhimillinen aktiviteetti, ja sen 
tulisikin edistää vapautta, hyvinvointia ja rauhaa. 

Habermasin käsitystä voidaan kutsua positiiviseksi. Pessimistisen ver- 
sion arvolatautuneesta tieteestä esittivät ranskalaiset poststrukturalistit. 
Michel Foucault, Jacques Derrida, Gilles Deleuze, Jean Baudrillard sekä Julia 
Kristeva kritisoivat käsitystä, että tieteellinen tieto olisi pelkästään objektii- 
vista ja neutraalia: rationaaliseen järkeen vetoaminen ei poista velvollisuutta 
tuoda esiin tieteen valtapyrkimyksiä. Heidän käsityksensä yhdistää Jacgues 
Lacanin psykoanalyysin, marxilaisen dialektiikan ja Friedrich Nietzschen 
nihilistisen käsityksen: tiede toimii myös dominanssin välineenä. 

Poststrukturalistisen liikkeen mukana esimerkiksi Judith Butler aloitti 
1970-luvulla feministisen tiedekritiikin ja herätti kysymyksen, onko tiede 
osa patriarkaalista valtarakennetta. Feministinen tieteentutkimus tutkii, 
missä määrin neutraali sukupuoli (esim. man tai human) viittaa tutkimuk- 
sissa miehiin, missä määrin naisten perspektiivi on mukana tutkimuk- 
sessa tai millä tavoin esimerkiksi metaforat ovat tieteessä maskuliinisia. 
Jotkin standardiesimerkit feministisessä kirjallisuudessa liittyvät kielen 
oppimiseen. Evoluutiopsykologiassa esitettiin esimerkiksi pitkään, että 
kieli kehittyi miehisen metsästysaktiviteetin tuloksena. Koska miehillä oli 
tarve koordinoida toimintaansa, he kehittivät kielen. Naisten rooli kielen 
opettajina, kommunikoijina ja erilaisten aktiviteettien koordinoijina puut- 
tui tästä teoriasta pitkään lähes kokonaan (Giere 1996; Longino 1990). 

Metodologiassa voi siten nähdä jaon seuraavanlaisiin teorioihin: en- 
siksi poststrukturalismin ja hermeneutiikan konstruktivistisiin teorioi- 
hin, joiden mukaan tieteellinen tieto luodaan eli konstruoidaan tiede- 
yhteisössä, ja toiseksi objektivistisiin teorioihin, jotka uskovat tiedon 
fundamentaaliseen realistiseen perustaan. Näiden välille on esitetty 
myös välittäviä näkemyksiä (esim. Longino 1990). 

Usein uskotaan erheellisesti, että monistinen ontologia välttämättä 
johtaa monistiseen metodologiseen käsitykseen. Ontologinen monismi 
ja metodologinen monismi eivät kuitenkaan suoraan edellytä toinen toi- 
siaan. Ontologinen pluralismi ja metodologinen pluralismi eivät nekään 
implikoi toisiaan. Todellisuutta voidaan hyvin pitää ontologisesti yhden- 
laisena tai monimuotoisena mutta silti esittää tieteelliselle tutkimukselle 
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yhdet yhteiset tai useat erilaiset kriteerit. Esimerkiksi jotkin neutraalin 
monismin teoriat ymmärtävät todellisuuden systeemien relaatioina: hy- 
vää tieteellistä tutkimusta leimaa siten todellisuuden systeemisen luon- 
teen ymmärtäminen. Kielentutkimuksessa juuri tällainen systeeminen 
näkökulma metodologiaan on erityisen tuttu ja luonteva: oletetaan kieli- 
järjestelmä ja voidaan tutkia sitä diakronisesta tai synkronisesta näkö- 
kulmasta (ks. Johdannon luku 3 tk.). Voidaan tutkia sitä sen osien ja 


toimintojen kautta. Myös eri kielijärjestelmiä (eri kieliä tai eri järjestel- 
miä saman kielen sisällä) voidaan verrata toisiinsa. Kielentutkimuksessa 
kieli ymmärretään usein järjestelmänä tai systeeminä, jota lähestytään 
jostakin näkökulmasta ja tutkimuskysymyksestä käsin. Näkökulma ja 
tutkimuskysymys ohjaavat metodin valintaa. Kielentutkimuksessa me- 
todiikkojen moninaisuus ja monimenetelmäisyys on tosiseikka ja elävä 
osa tieteenalan tutkimusarkea. Kuviossa 11 on esitetty puukuviona tässä 
luvussa käsitelty metodologinen asemoituminen. 


1. Uskomuksen muodostamisen tapoja 


2. Tieteellisten perustelujen muodostamisen tapoja 


formaalitieteet 


3. Kielen ontologinen taustateoria 


reaalitieteet 


totuusteoriat 


4. Metodologinen asemoituminen 
Kuvio 11. Metodologinen asemoituminen kielentutkimuksessa. 


JOHDANTO 2. TIETO, TIETEELLINEN TIETO JA TIETEELLINEN MENETELMÄ 83 


2.6. Looginen rakenne 


Tieteellinen tutkimusasetelma on argumentin tai perustelun rakenta- 
mista. Tämä tarkoittaa, että tieteellisellä tutkimuksella on looginen ra- 
kenne. 1600-luvulla empiristit alkoivat korostaa yhä voimakkaammin, 
että tieteessä tutkimusasetelmien tai metodien tulisi rakentaa todelli- 
suuden kanssa sellainen vuorovaikutuksellinen suhde, jonka kuvaa- 
mista tieteellisessä julkaisussa voisi käyttää väitteen perusteena. Kuka 
tahansa, joka olisi saanut riittävän koulutuksen, voisi ymmärtää, miten 
metodia soveltamalla on päästy pääväitteeseen. Tutkimuksilta alettiin 
vaatia siis aivan tietynlaista loogista rakennetta. Samalla vakiintui käsi- 
tys, että tieteen tehtävä on antaa selityksiä. Selitys eroaa argumentista 
siinä, että se esittää syyn tapahtuneelle, kun taas argumentti esittää pe- 
rustelut väitteelle uskoa jokin asia. Esimerkiksi: 


Argumentti: ”Mato on kuollut, koska elonmerkkejä ei havaita.” 
Selitys: ”Mato on kuollut kuivumiseen.” 


Selitysten erityinen arvo on siinä, että niitä voi käyttää ennusteina. Jos 
jonkin tapahtumaketjun alkusyy tunnetaan, voidaan ennustaa tuleva 
tapahtuma. 


Ennuste: ”Kuivuminen aiheuttaa madolle vakavan terveysriskin ja 
lopulta kuoleman.” 


Valistuksesta alkusysäyksensä saanutta tieteellistä vallankumousta ja 
sen mukanaan tuomaa teollista vallankumousta ja teknologiakehitystä 
seuraavien vuosisatojen aikana pidetään usein juuri selittävän tutkimuk- 
sen ja pätevien ennusteiden ansiona. Viime vuosisadalla tieteellisen tut- 
kimuksen ajateltiin olevan myös demokratian ja toimivan yhteiskunnan 
edellytys. Usein nykykäsitys näyttää kuitenkin olevan, että tekno- 
logisessa ja taloudellisessa kilpajuoksussa menestyminen vaatii pelkäs- 
tään selittävää tutkimusta. Voidaan siis edelleen havaita preferenssi se- 
littävään tutkimuksen, jossa selvennetään ilmiön syitä (vrt. kuvaileva tai 
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ymmärtävä tutkimus (ks. Johdannon luku 2.5. tk.). Ongelma tällaisissa 


preferensseissä on yleensä se, että ei huomata deskriptiivisen ja synteti- 
soivan perustutkimuksen olevan usein selittävän tutkimuksen edellytys. 

Selittävän tutkimusasetelman rakennetta alettiin pohtia siis jo 
1600-luvulla. Esimerkiksi termi eksperimentti (koe, koeasetelma) alkoi 
tällöin esiintyä useamman tieteenfilosofin kirjoituksissa. Aluksi termillä 
näytettiin tarkoitettavan vain sellaista tutkimusasetelmaa, joka käyttää 
kokemustietoa. Ensimmäisen eksperimentin julkaisi italialainen lääkäri 
Francisco Redi (1627-1697). Hän selvitti, pitääkö paikkansa se Aristote- 
leen (1994) väite, että kärpäset syntyvät spontaanisti maatuvasta ainees- 
ta. Redin päämääränä oli esittää perusteita vastakkaiselle näkemykselle. 
Redin koe perustui siihen, että kahteen ryhmään lasipurkkeja sijoitettiin 
maatuvia aineita mutta vain toisen ryhmän purkkeihin laitettiin kansi 
päälle. Tulos osoitti, että vain kannettomiin purkkeihin ilmestyi kärpä- 
siä, eli väite kärpästen spontaanista syntymisestä ei pitänyt paikkaansa 
(Lockshin 2007, 142; Konstenius 2014, 40). 

John Stuart Mill analysoi käsitteellisesti Redin käyttämät metodo- 
logiset periaatteet. Mill järkeili, että kokeellinen tutkimusasetelma pe- 
rustuu erottavan tekijän periaatteeseen. Erottavan tekijän periaate esit- 
tää, että tutkimusasetelma rakennetaan siten, että voidaan seurata kahta 
samanlaista prosessia, jotka eroavat vain yhden tekijän osalta. Tällöin 
on mahdollista seurata sitä, onko tämä yksi tekijä se, joka saa aikaiseksi 
oletetun vaikutuksen. Jos siis halutaan osoittaa, että A on B:n syy (A > 
B), on suljettava pois jokainen muu mahdollinen vaikuttava tekijä kont- 
rolloimalla ne. Kontrolloiminen ja poissulkeminen tapahtuvat vertais- 
ryhmän avulla. Kun ryhmillä C1 ja C2 on samat kontrolloidut olosuhteet 
mutta vain ryhmä Ci käsitellään riippumattomalla muuttujalla A:lla, 
saadaan selville, onko A:lla vaikutusta B:hen. Vertailemalla ryhmiä kä- 
sittelyn jälkeen voidaan havaita, tapahtuiko vaikutus B vain ryhmässä 
Ci. Fksperimentti perustuu näin ollen eliminatiiviseen inferenssiin, eli 
suljetaan pois vaihtoehtoiset selitykset kontrolloimalla ne eksperimen- 
tissä vertaisryhmän avulla (Godfrey-Smith 2003, 212; Konstenius 2014, 


40-45). 
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Eksperimentti on tutkimusasetelma, jolla on seuraava looginen ra- 
kenne: 


Hypoteesi: A — B (A aiheuttaa B:n) 


Kilpailevat hypoteesit: Hn — B (muut tekijät, jotka voivat aiheuttaa 
B:n) 


Ryhmä Ci ja C2 (ryhmä Ci, johon vaikutetaan, ja kontrolliryhmä C2) 
t1 = alkuhetki ja t2 = päätöshetki (kokeen alkamis- ja päättämishetki). 


Seurataan samanaikaisesti kahta eri prosessia. B on A:n seuraus vain, 
jos B seuraa ajallisesti A:n jälkeen, ja ainoastaan siinä tapauksessa, että 
ilman A:ta B ei esiinny: 


tr AHn(Cr) — t2 Cr 
tr Hn(C2) — ta C2 


Mill ja hänen aikalaisensa osoittivat, että tutkimusasetelmilla on usein 
loogisen argumentin rakenne. Tutkimusasetelma tai tieteellinen metodi 
ei siten ole mikä tahansa havainnointitilanne tai tapahtuma. Tieteellinen 
metodi on käytännöllinen prosessi, joka päämäärähakuisesti toteuttaa 
rakennetta, jonka tieteellisessä argumentaatiossa on määrä vakuuttaa 
järki. Tutkimusprosessi vuorostaan on se ajallis-paikallinen tapahtuma, 
jossa tuota rakennetta suoritetaan (ks. Kakkuri-Knuuttila 1998). 

Argumentaatiossa sellainen esitys, joka perustuu logiikkaan ja 
joka sulkee pois muut vaihtoehtoiset hypoteesit, on hyvin vakuuttava. 
Eksperimentti ja siitä johdettu kausaaliselitys muodostivat siksi pitkään 
tieteen ihanteen, sillä sen koettiin tarjoavan muita tutkimusasetelmia 
paremmin sellaista evidenssiä, jonka perusteella voidaan selittää ja en- 
nustaa todellisuuden tapahtumia. 

Pitkällä aikavälillä metodologian ja logiikan alan työ kuitenkin osoit- 
ti, että tutkimusasetelmilla ja metodeilla yleisesti on parhaimmillaan 
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sellainen looginen rakenne, joka on pätevää päättelyä suhteessa 
tutkimuskysymykseen. Kausaaliselitystä etsivä tutkimusasetelma onkin 
järkevä vain silloin, kun etsimme selittävää tekijää eli syytä. Jos tutkijaa 
esimerkiksi kiinnostaa subjektien kokemus tai vaikkapa jokin määräl- 
linen kysymys, tulee hänen käyttää toisenlaisia metodeja. Tutkimus- 
kysymys siis ohjaa metodin valintaa ja sen arviointia, onko tutkimus- 
prosessin rakenne looginen vastaus kysymykseen. Jos esimerkiksi 
halutaan tietää, millä tavoin suomen kielen itsenäiset infinitiivit toimivat 
affektin ja empatian konstruktioina (esim. miettiä nyt tällaisia asioita, ks. 
Visapää 2013), ei kokeellinen tutkimusasetelma, jossa koetellaan selit- 
tävää tekijää, ole kovin mielekäs. Sitä vastoin elokuva, kirja tai verkko- 
keskustelu voivat tarjota sellaista materiaalia, josta tutkija voi rakentaa 
aineistoon perustuvan tutkimuksen, jossa tarkastellaan sitä, millä tavoin 
tunnepitoinen merkitys rakentuu kielen ja kontekstin yhteisvaikutuk- 
sessa. Kuten monet kielen ilmiöt affektiivisuus on vuorovaikutuksen 
läpinäkyvä ilmiö, jonka ilmentymät kielessä ovat systeemisessä vuoro- 
vaikutuksessa niin kielisysteemin sisäisten kuin ulkoisten tekijöiden 
kanssa. Kieli-ilmiöiden erottelu ja analyysi edellyttävät kielentutkijan 
usein myös vertaavan luokitteluaan ja analyysiaan vastaesimerkkien 
valossa. Vastaesimerkkien käyttö kielitieteellisessä argumentaatiossa, 
esimerkiksi ei-affektiivinen kielenkäyttö, voimistaa esitetyn argumentin 
evidenssiperustaa. 

Hyvä tieteellinen argumentaatio, pätevä päättely ja tieteellinen 
tutkimusasetelma implikoivat toinen toistaan reaalitieteissä. Yleinen 
näkemys on se, että tutkimuksen kohde ja sen ontologia määräävät 
metodin perusteita ja sitä, mikä on pätevää päättelyä. Esimerkiksi Jane 
Austenin tuotantoa ei voi tulkita kokeellisesti, eikä farmakologiassa saa 
tietoa molekyylien rakenteesta hermeneuttisella tulkinnalla. Toivottavaa 
olisi, että tutkittaisiin lisää ja seikkaperäisemmin sitä, millä tavoin tie- 
teellisiä argumentteja rakennetaan juuri kielentutkimuksessa. Yleistä 
on, että argumentaation rakenne vaihtelee metodiikan eri alueilla. Me- 
todiikka jaetaan yleensä neljään osaan: 
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1. Aineiston keräämisen tekniikat: otantatekniikka ja kokeiden suun- 
nittelu, havainnointi, eksperimentit (koeasetelmat), kyselyt, mittaa- 
minen ja kerääminen. 

2. Aineiston kategorisoimisen ja kuvaamisen tekniikat: laadullisen 
aineiston luokittelu, numeeristen aineistojen muodostaminen, 
korpusaineistojen annotointi, tunnuslukujen ja kategorioiden 
muodostaminen. 

3. Aineiston analyysin tekniikat: tilastolliset ja matemaattiset mene- 
telmät, taustateoriat laadullisessa jäsennyksessä. 

4. Päätelmien tekemisen tekniikat: päätösteoriat, virheteoria, 
kausaalianalyysi, tilastollisten testien teoria. 


Tieteen kehittyessä jokaiseen edellä esitettyyn metodiikan vaiheeseen 
1-4 liittyy eri aloilla erilaisia vaatimuksia argumentin rakentamisesta. 
Esimerkiksi aineistojen keräämiseen liittyy usein erilaisia alakohtaisia 
perusteluja ja rationaliteetteja sen mukaan, minkä tyyppistä argument- 
tia ollaan rakentamassa ja millainen on se ekologinen validiteetti (vas- 
taavuus todellisuuden kanssa), johon pyritään. Esimerkiksi yhtä kieltä 
koskevan korpuslingvistiikan ja monta kieltä rinnakkain tutkivan typo- 
logian tavat kerätä ja tasapainottaa aineistoa eroavat toisistaan. Otanta- 
tekniikalla, joka on menettelytapa otoksen määrittämiselle jostakin 
perusjoukosta, pyritään osoittamaan, että tutkimuksen tuloksena oleva 
väitelause kattaa sen alueen, johon se on yleistetty. Pyrkimys validiteet- 
tiin toisin sanoen vaikuttaa kullakin kielentutkimuksen osa-alueella 
argumentaation rakenteeseen ja logiikkaan. 

Sellaisiin tutkimusasetelmakokonaisuuksiin, joissa yhdistyvät imp- 
lisiittisesti jotkin edellä esitetyt metodiikan osat 1-4, tai erityisiin mit- 
taamisen mahdollistaviin kokonaisuuksiin viitataan toisinaan myös 
paradigma-termillä. Tieteenalalle vakiintunutta paradigmaa monesti 
toistetaan ilman, että sen perusteita enää pohditaan erikseen tutkimus- 
asetelmissa. Operationaaliset määritelmät takaavat tutkimuksen tois- 
tettavuuden, mutta ne ovat luonteeltaan keinotekoisia ja usein käsit- 
teellisesti köyhiä. Tavallisesti jokin tietty operationaalinen määritelmä 
vakiintuu tieteellisessä kirjallisuudessa tiettyyn tutkimusasetelmaan si- 
ten, että tutkijat käyttävät keskenään samaa operationaalista määritelmää 
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riippuvan ja riippumattoman muuttujan määrittelemiseen paradigman 
sisällä (Forzano & Gravetter 2009, 74). Kaikki paradigmat perustuvat 
kuitenkin joukkoon taustaoletuksia, jotka eivät välttämättä aina ole 
oikeita. 

Termi paradigma on peräisin Thomas Kuhnilta (1962), joka esitti, että 
normaalitieteessä tutkimusasetelmien rakentamista ohjaa joukko tausta- 
oletuksia. Normaalitiede on vaihe, jossa joukko ilmiöitä on hyväksytty 
tosiseikoiksi ja suuri osa harjoitetuista tutkimuskäytännöistä kyseen- 
alaistamattomiksi metodeiksi. Näiden tosiseikkojen ja metodien hyväk- 
syminen perustuu taustaoletuksiin, joita ei kuitenkaan välttämättä enää 
kerta kerralta lausuta tutkimuksen kuluessa vaan tutkimusasetelmaa tois- 
tetaan tiedeyhteisön hyväksyessä taustaoletukset. Paradigman vaihdos tai 
muutos tapahtuu tieteessä silloin, kun tiedeyhteisö tai kilpaileva koulu- 
kunta ei hyväksy taustaoletuksia. Kuhnin mukaan standarditutkimukses- 
sa kopioidaan tutkimusasetelma, termit ja osittain tuloksetkin tai usein 
ainakin tulosten esittämistavat. Standarditieteessä ei kyseenalaisteta para- 
digmaa eli taustateoriaa ja metodia. Nykyään ajatellaan, että Kuhnin käsi- 
tys yhdestä standarditieteestä oli liian yksinkertainen. Tosiasiassa tieteen- 
alan sisällä toimii joukko suuntauksia, joissa toimii keskenään kilpailevia 
koulukuntia. Koulukuntien välillä voi olla enemmän tai vähemmän yksi- 
mielisyyttä hyväksyttyjen paradigmojen laadusta ja määrästä. Tieteellinen 
tutkimus on siten kirjavampi, heterogeenisempi ja dynaamisempi myös 
ns. standarditieteen aikana kuin, mitä Kuhn näytti ajattelevan. 

Kuhnin oppilas Philip Kitcher (1981) on esittänyt näkemyksen, että 
tieteellinen selitys g on relaatio, joka propositiolla on selitettävään il- 
miöön p, mutta selitys g on hyväksyttävissä vain suhteessa johonkin 
metateoriaan. Kitcherin määritelmän mukaan metateoria on systema- 
tisaatio, joka parhaiten selittää joukon hyväksyttyjä faktoja ilmiöstä p. 
Tällainen selittävä metateoria on esimerkiksi Newtonin mekaaninen 
maailmankuva, Einsteinin suhteellisuusteoria tai Darwinin evoluutio- 
oppi. Metateoria selittää joukon aikaisemmin irrallisia havaintoja ja 
ennustaa tulevia havaintoja, mutta siihen viitataan usein vain implisiit- 
tisesti varsinaisissa tutkimusjulkaisuissa. Mitä hyväksytympi on para- 
digma, sen implisiittisemmäksi sen tietorakenne muuttuu tutkimus- 
julkaisuissa, sillä tiedeyhteisön konsensus liittää sen automaattisesti 
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osaksi kollektiivisesti omaksuttua metateoriaa, jonka valossa uusia se- 
lityksiä arvioidaan. 

Kuviossa 12 selvennetään Kitcherin ajatuksia yhdistävästä selittä- 
misestä (engl. Explanatory Unification). Systematisoivat metateoriat, 
kuviossa 12 Z-teoriat, muodostavat tiettynä ajankohtana tutkimuksen 
paradigman, jota ei tutkimuksen kuluessa kyseenalaisteta. Z-teoriat 
muodostavat keskenään mahdollisimman yhtenäisen maailmankuvan, 
eivätkä ne kilpaile toistensa kanssa. K-teoriat ovat jonkin alan varsinai- 
sia tutkimuksen taustateorioita. Tällaisia ovat kielentutkimuksessa esi- 
merkiksi konseptuaalinen semantiikka, kieliopillistumisteoria tai histo- 
riallis-vertaileva menetelmä. K-teoriat kilpailevat keskenään, ja niiden 
tavoitteena on arkitutkimuksen tasolla selittää mahdollisimman paljon 
tutkimuskohteen ilmiöitä koherentisti. 


Z-teoriat muodostavat paradigman, eikä Z-tasoa kyseenalaisteta K- tai T-tutkimuksen tasolla. 


K-teoriat kilpailevat keskenään ja toimivat T-tason tutkimuksen taustateorioina. 


T-taso: arkitutkimus, joka perustuu johonkin K-teoriaan ja kohdistuu H-tasoon. 


H-taso: tutkimuskohde ja selitettävät ilmiöt. 


Kuvio 12. Kitcherin (1981) malli yhdistävästä selittämisestä. 


On syytä panna merkille, että Kitcher käyttää metateoria-termiä eri merki- 
tyksessä kuin, miten se tämän kokoelman alussa määriteltiin. Edellä mää- 
riteltiin metateoria ylätason tutkimusnäkökulmaksi tai tutkimusalaksi. 
Kitcher vuorostaan käyttää termiä implisiittisen taustateorian merkitykses- 
sä: Z-tason teoriat ovat mykkiä todeksi hyväksyttyjen taustateorioiden jouk- 
koja, jotka ohjaavat varsinaisten eksplikoitujen teorioiden rakentamista. 
Kun tarkastellaan kielentutkimusta kitcheriläisessä käsitteistössä, 
tieteenalan sisällä voidaan havaita erilaisia metateoreettisia koulukuntia. 
Huomataan, että on olemassa eriäviä paradigmaattisia näkemyksiä kie- 
len olemuksesta. Esimerkiksi generativistit (formalistit) ja funktionalistit 
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tekevät tutkimusta eri metateorian sisällä. Metateorian keskeisiä ole- 
tuksia (omaksuminen vs. oppiminen, komputationalismi vs. konnek- 
tionismi, rationalismi vs. empirismi jne.) ei eksplikoida yhä uudestaan 
tutkimusjulkaisuissa, vaan ontologiset, tietoteoreettiset ja metodologiset 
perusteet oletetaan yleensä julkaisuissa tunnetuiksi ja yleisesti hyväksy- 
tyiksi kunkin suuntauksen sisällä. 

T-tasolla, esimerkiksi semantiikassa tai pragmatiikassa, voi siten työs- 
kennellä rinnakkain samankaltaisin metodein eri koulukuntien edustajia. 
Tämä tarkoittaa sitä, että käytössä voi olla vaikkapa sama havainnointiin 
perustuva otanta- ja havainnointitekniikka mutta taustateoria K on erilai- 
nen; toinen käyttää teoriaa Ki ja toinen teoriaa K2 tutkimuksessaan. Kun 
tutkimuksessa metodit ovat samankaltaiset ja ainoastaan taustateoriat 
eroavat toisistaan, tulee olla erityisen tarkka samaan ilmiöön viittaa- 
vien termien kanssa, sillä päällepäin termeillä näyttäisi olevan viittaus- 
kohteensa ja homonyymisyytensä vuoksi sama merkitys, mutta erilaisten 
taustateorioidensa vuoksi ne ovat eri tavoin teoriapitoisia (ks. Johdannon 
luku 2.4. tk.). Toinen termi on Ki- ja toinen K2-pitoinen, sillä niiden 
merkityssisältöön vaikuttaa taustateorian käsitejärjestelmä. Tällaiset ter- 
mit, joilla on sama muoto mutta jotka ovat eri tavoin K-pitoisia, edustavat 
taustakäsitejärjestelmiensä perusteella eri käsitteitä. Esimerkiksi kognitio 
viittaa Langackerin kognitiivisessa kieliopissa (1987) erilaiseen ilmiöön 
kuin Searlen (1992) tai Roschin (1975) tutkimuksissa (ks. Kenttä 2003). 

Jotta teorian käsitejärjestelmä pysyisi koherenttina ja loogisena, sitä 
koskee joukko vaatimuksia (Karihalme 1996). Tällaisia ovat esimerkiksi 
seuraavat: 


1) Yksimerkityksisyys: määritelmät annetaan siten, että jokaista 
merkitystä käsitejärjestelmässä nimeää tarkkaan vain yksi termi ja 
tämä termi nimeää vain yhtä ilmiötä. ' 

2) Perusteltavuus: käsite on motivoitu taustateoriassaan. 

3) Informatiivisuus: käsitteen olemassaolo kertoo jotakin uutta mal- 
lista, jota se kuvaa. 

4) Järjestelmällisyys: käsite organisoi koko käsitejärjestelmän 
tietosisältöä. 

5) Rajaavuus: käsitteen ekstension alaa kontrolloidaan teoriassa. 
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Tieteen tavoitteena pidetään informatiivisia totuuksia, ja oletus on, että 
yllä olevia ohjeita noudattamalla tähän tavoitteeseen päästään. Oletetaan, 
että kun yksimerkityksisyyden, perusteltavuuden, informatiivisuuden ja 
järjestelmällisyyden ihanteita noudatetaan, teorian käsitejärjestelmä on 
looginen ja termien referentit tunnetaan täsmällisesti. Lopputuloksena 
on teksti, joka on informatiivista ja totta. 

Tieteellistä käsitteenmäärittelyä koskevat normit ja tavoitteet tulee 
erottaa tosiasiallisesta terminologian tutkimuksesta. Tiedettä ohjaavat 
pelisäännöt ovat eri asia kuin luonnollista tai tieteellistä kielenkäyttöä 
tosiasiassa ohjaavat sosiolingvistiset periaatteet. Normatiivisista mää- 
ritelmistä poiketen tieteellisten termien funktionaaliset määritelmät 
perustuvat yhteisesti jaetuille kielenkäytön tavoille (ks. esim. Gambier 
1987; 1991; Gaudin 1993; 2005; Pearson 1998; Temmerman 2000). Sa- 
malla tavoin kuin tieteen pelisäännöt (eli normatiivinen tieteenfilosofia) 
ja varsinainen tieteentutkimus (esim. deskriptiivinen tieteenhistoria) 
ovat kaksi eri tutkimusaluetta, niin tieteellisen käsitteenmuodostuksen 
ja terminologian tutkimus ovat kaksi erillistä tutkimuksen aluetta. Tie- 
teellinen käsitteenmuodostus on normatiivista, sillä kun normeista poi- 
ketaan, termeistä tulee häilyviä ja monimerkityksellisiä eikä ole enää 
välttämättä selvää, mitä kirjoittaja kulloinkin tarkoittaa. Terminologian 
tutkimus kuvaa yleensä juuri tätä tosiasiallista termien polysemiaan joh- 
tavaa kielenkäyttöä. Fi voida esimerkiksi varmasti sanoa, mitä termillä 
kognitio kulloinkin tarkoitetaan, mikäli sitä käytetään tarkoittamaan sekä 
mieltä että sen sisältöä, sekä tietoista että tiedostamatonta mieltä, sekä 
yksilömieltä että intersubjektiivista jaettua mieltä tai sekä abstrakteja 
ideoita että neurokemiallisia prosesseja. 

Tieteellisen käsitteenmuodostuksen normatiivisuus tarkoittaa, että 
tutkijalla on vapaus määritellä käyttämänsä käsitteet siten, että hänen 
käsitejärjestelmänsä pysyy loogisena. Se tarkoittaa myös, että tutkijalla on 
velvollisuus päämäärähakuisesti määritellä käsitteensä (Niiniluoto 1980b, 
164). Tuo päämäärä on tieteessä tieto tai totuus, ja päästäkseen tähän 
päämäärään tieteellisen määritelmän on täytettävä ainakin neljä ehtoa: 


1. Määritelmän täytyy ilmaista määriteltävän olemus. 
2. Määritelmä ei saa olla kehämääritelmä. 
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3. Määritelmää ei saa lausua negatiivisin ehdoin, jos se voidaan lau- 
sua positiivisin kriteerein. 
4. Määritelmää ei saa ilmaista kuvaannollisella tai epäselvällä kielellä. 


Käsitteiden määritteleminen vaatii omien ja kilpailevien koulukuntien 
taustateorioiden tuntemusta. Tutkijan omat käsitteet määritellään suh- 
teessa omaan käsitejärjestelmään sekä kilpailevien koulukuntien käsit- 
teisiin. Määritelmässä kerrotaan selkeästi, millä tavoin oma käsite eroaa 
muista samaa ilmiötä nimeävistä käsitteistä. Whiteheadin (1929) mu- 
kaan teoria on sisäisesti looginen ja sen käsitejärjestelmä koherentti, 
mikäli seuraavat seikat toteutuvat: 


1. Lauseet eivät ole keskenään ristiriitaisia, vaan ne ovat loogisesti 
konsistentteja. 

2. Eri väitteistä seuraavat päätelmät (esim. miten metodeja sovelle- 
taan) eivät ole keskenään ristiriidassa. 

3. Väitteet siitä, mitä maailmassa on tai mikä on maailman perim- 
mäinen rakenne, eivät ole keskenään ristiriidassa (onttiset ja onto- 
logiset kysymykset, ks. Johdannon luku 2.4. tk.). 


4. Käsitteiden intensio ja ekstensio pysyvät teoriassa konsistentteina. 


Tieteellinen käsitteen- ja teorianmuodostus on tavoitteellista toimintaa, 
jota jokainen tutkija ihanteellisesti harjoittaa tunnollisesti. Tieteellinen 
käsitteenmuodostus on tieteen ihanne, sillä se johtaa tieteellisesti päte- 
vään tietoon. Tosiasia on, että mitä laajemmassa käytössä tieteellinen ter- 
mi on, sitä prototyyppisempi on käsitteen rakenne: tietty perusmerkitys 
yleensä säilyy kategorian ytimessä. Tieteessä käsitteiden merkitys- 
neuvottelut ovat kuitenkin moninaiset. Tieteellisten termien tiukka stan- 
dardisointi on siten harvoin mahdollista, jos edes toivottavaa. Tieteelli- 
sen tutkimuksen tavoite on kuvata, löytää ja selittää uusia asioita. Uudet 
ilmiöt johtavat usein uusiin määritelmiin ja käsitteisiin. Tiede edistyy, ja 
se tarkoittaa sitä, että myös määritelmät ja merkitykset kehittyvät. 

Jopa yhdenkin tekstin sisällä kirjoittajan käyttämien käsitteiden mää- 
ritelmien kartoittaminen ja ymmärtäminen voivat olla suuren analyyt- 
tisen työn tulosta. Esimerkiksi Wittgensteinin kielipeli-käsitteestä on 
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julkaistu vuodesta 1956 lähtien lukuisia tutkimuksia, eikä tunnu olevan 
odotettavissa, että tahti hidastuisi. Terminologian tutkimus osoittaa, 
että tieteelliset käsitteet ovat kiinteä osa taustakäsitejärjestelmäänsä ja 
teoriaa, eikä atomaaristen standardimääritelmien antaminen ole kovin 
realistista. Se myös osoittaa, että tieteellisen käsitteenmuodostuksen 
normien noudattamien on tieteessä erittäin tärkeää. Mitä suurempi on 
vaara, että tieteellinen kieli muuttuu epätarkaksi, sitä suurempi on tut- 
kijan velvollisuus määrittää käsitteensä. 

Kuviosta 13 huomataan, että argumentaation rakenne seuraa metodo- 
logista asemoitumista. Metodi on tutkimuksen logiikkaa, joka muodos- 
taa osan väitteen perusteluista ja siten oleellisella tavalla määrittää tavoi- 
teltavan tieteellisen argumentin rakennetta. Tieteellistä argumentaatiota, 
käsitteen- ja teorianmuodostusta koskee joukko yleisiä periaatteita, joita 
on myös käsitelty tässä luvussa. 


1. Uskomuksen muodostamisen tapoja 


2. Tieteellisten perustelujen muodostamisen tapoja 


formaalitieteet 


3. Kielen ontologinen taustateoria 


reaalitieteet 


totuusteoriat 


4. Metodologinen asemoituminen 
5. Tutkimuksen looginen rakenne 


Kuvio 13. Metodi on looginen rakenne. 
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27. Etiikka 


Metodit ovat tieteen sääntöjä, ja niiden soveltamiseen liittyy joukko 
eettisiä normeja. Tämä tarkoittaa sitä, että metodin soveltamisen tapaa 
määrittävät sellaiset oikeaa ja väärää koskevat kysymykset, joihin tiede- 
yhteisö etsii kollektiivisesti vastauksia. Tiedeyhteisön antamat vastauk- 
set moraalifilosofisiin kysymyksiin ovat normatiivisia, eli ne sitovat ja 
velvoittavat yksittäistä tutkijaa. Mikäli tieteen tutkimuseettisiä normeja 
ei tutkimuksessa noudateta, tutkimus ei täytä tieteellisyyden kriteerejä. 

Tutkimusetiikka tarkoittaa kaikkia niitä oikeaan ja väärään liittyviä ky- 
symyksiä, jotka suoraan kohdistuvat metodiin ja esimerkiksi datan säily- 
tykseen, anonymisointiin, henkilöiden yksityisyyteen ja turvallisuuteen 
jne. Tieteen etiikka liittyy vuorostaan laajemmin tutkijan, tutkimuksen 
ja tieteellisen tiedon rooliin yhteisössä. Tutkimuskysymys, käsitteistö 
ja tutkimuksen konteksti kuuluvat tieteen etiikkaan. Tutkimustulosten 
tulkinta ja julkaisukonteksti ovat niin ikään ns. laajan vastuun aluetta 
(ks. Johdannon luvut ja 4 tk). 


Tutkimuksen etiikka alkaa tutkimusongelman eettisestä muotoilus- 
ta. Kysymyksen muotoilu johtaa tutkimusasetelman arkkitehtuuriin ja 
niihin alakysymyksiin, joihin tutkimuksen kuluessa vastataan. Jos tut- 
kimus kohdistuu ihmisryhmiin tai sellaisiin ihmisryhmän ominaisuuk- 
siin tai kulttuureihin, joiden muotoutumiseen ryhmän nykyjäsenten voi 
katsoa olevan osallisia, Creswell (2003, 63) ehdottaa pilottitutkimusta, 
jotta tutkimusongelma ja tutkimusasetelmassa käytetty käsitteistö muo- 
toiltaisiin heti alussa siten, etteivät ne marginalisoisi tai heikentäisi ryh- 
män etuja. Tutkimuksen tulokset on julkaistava totuudenmukaisesti, ja 
siksi on oleellista, että tutkimusasetelma alkuaan on neutraali ja ottaa 
huomioon osallistujien oikeudet. 

Jotta yhteiskunta voisi ottaa kantaa siihen, onko tutkimus yhteis- 
kunnan tavoitteiden ja arvojen mukaista, tutkimuseettisiin neuvottelu- 
kuntiin ja toimikuntiin (esimerkiksi Suomen TENK, ks. https://www. 
tenk.fi/) otetaan tieteellisten jäsenten lisäksi maallikkojäseniä. Vuodesta 
2009 lähtien vaatimus ihmiseen kohdistuvan tutkimuksen eettisestä 
ennakkoarvioinnista on koskettanut Suomessa myös kielentutkimusta. 
Tämä tarkoittaa sitä, että kielentutkimuksen eettisiä huolenaiheita ei voi 
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määritellä vain tieteenalan sisältä käsin vaan kielentutkimusta on tar- 
kasteltava myös vallitsevien yleisten ohjeiden, yhteiskunnan keskeisten 
arvojärjestelmien ja koodien näkökulmasta. Kielentutkijan on muun 
muassa pidettävä huolta siitä, että hänen käyttämänsä metodologinen 
käsitteistö vastaa standardimalleja. 

Tutkijan on esimerkiksi Tutkimuseettisen neuvottelukunnan (TENK) 
vaatimukset täyttääkseen kyettävä erottamaan erilaiset metodit ja meto- 
dien erityispiirteet toisistaan sellaisin termein, joilla yleiset tutkimus- 
eettiset ohjeet on esitetty. Esimerkiksi eksperimentti-termin käyttö edellyt- 
tää, että tutkija on käyttänyt kontrolliryhmää vaihtoehtoisten hypoteesien 
poissulkemiseksi. Erilaisiin tutkimustyyppeihin liittyy erilaisia eettisiä 
huolenaiheita, joista tutkijan on oltava tietoinen tutkimusasetelmaa ra- 
kentaessaan tai ennakkoarviointihakemusta tehdessään. TENK ohjeistaa 
myös humanisteja metodien totuudesta: vilppi, väärennös ja vääristely 
ovat rangaistavia. Huolellisuus on enemmän kuin hyve: se on vaatimus." 

Tieteellinen tutkimus on nykykäsitysten mukaan suoritettava siten, 
ettei siitä koidu vahinkoa tutkittavalle. Potentiaalisia vahinkoalueita ovat 
fyysinen ja psyykkinen hyvinvointi, yksityisyys ja henkilön autonomi- 
suus. Kieliaineiston hankkimistapoja tulee kuitenkin reilusti proble- 
matisoida suhteessa muiden alojen käytäntöihin ja riskimääritelmiin. 
Linguistic Society of America (LSA) on esimerkiksi korostanut sitä, että 
kieliaineiston hankinta on lähes aina luonteeltaan minimiriskistä. Vaik- 
ka kenttätutkimuksessa käytettäisiinkin kielenoppaiden pohdinnoista 
termiä ajatuskoe, tätä ”koetta” ei ole mielekästä vain metodin nimen pe- 
rusteella asettaa samanlaisten sääntöjen ja rajoitusten kohteeksi kuin 
esimerkiksi biolääketieteellisessä tutkimuksessa käytettyjä aineistoja 
(kudosnäytteitä, potilasrekistereitä jne.). 

Kielentutkija voi tieteellisyyttä korostaakseen haluta käyttää erilaisia 
koe- tai eksperimentti-termejä, mutta on tärkeä huomata, että niiden käy- 
tön tulisi kuitenkin vastata eksperimenttimetodin tosiasiallisia määritel- 
miä. Erityisesti kuitenkin etiikkaa pohdittaessa kieliaineiston vahinko- ja 
riskikriteerejä tulisi problematisoida kielentutkimuksen omilla ehdoilla 
(Konstenius 2014, 66-70). Muiden alojen terminologiset ratkaisut eivät 
siis välttämättä ole suoraan sovellettavissa kielentutkimukseen. Tietoi- 
sesti tutkijalle julkaistavaksi annettu informaatio alkujaan jo julkisesta 
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kielitiedosta ei täytä salaamiseen, turvaperiaatteisiin ja kodifikaatioon 
käytettäviä eettisiä ennakkoehtoja. Myöskään kielentutkimuksen ai- 
neistosta johdetut päätelmät eivät LSA:n mukaan aiheuta kieliryhmän 
jäsenille henkilökohtaista henkistä tai fyysistä vahinkoa. Tämä johtuu 
siitä, että kielentutkimuksen aineisto päätelmien kohteena ei yleensä ole 
henkilökohtaisesti ketään yhtä ihmistä koskevaa. Kielitieto on yleensä 
yhteisön julkista tietoa" ja harvoin yksilön näkökulmasta ongelmallista. 
Sitä vastoin politiikka, uskonto ja etnisyys ovat empiirisen kielidatan 
keräämisen eettisten valintojen konteksteja, joista tutkijan tulee olla tie- 
toinen (Konstenius 2014, 66-80). 

Suomessa TENK (2012) on päättänyt, ettei tutkimuseettistä ennakko- 
arviointia tarvita, kun kyseessä on normaalipopulaatio. Nuoriltakin 
saa kysyä, jos tutkimus suoritetaan osana koulun normaalitoimintaa. 
Sellaiset tutkimukset, joissa ei kerätä yksilöityjä tunnistetietoja, voi- 
daan suorittaa ilman huoltajan lupaa. Muussa tapauksessa tarvitaan 
ennakkoarviointia. Kielentutkimuksessa tutkimuksen kohteena eivät 
pääsääntöisesti ole yksittäisen ihmisen vaan kollektiivisen kielen omi- 
naisuudet. Siksi yksityisten ihmisten anonymiteetti voidaan laajoissa ai- 
neistoissa varsin helposti taata. McEnery ja Hardie (2011, 66) kuitenkin 
esittävät, että suojaus on tehtävä aina riippumatta siitä, onko materiaali 
yksityisluonteista, sillä koskaan ei voi tietää, mitä tulevaisuus tuo tul- 
lessaan. Tutkimusetiikkaa käsitellään tarkemmin johdannon luvussa 4. 

Kuviossa 14 etiikka on viimeinen niistä ehdoista, jotka kielen- 
tutkimuksen on täytettävä, jotta voitaisiin puhua tieteellisestä metodis- 
ta. Tieteellä on useita erilaisia menettelysääntöjä jokaisessa kuudessa 
eri tieteellisen metodin ehdossa, kuten tässä luvussa on käynyt ilmi. 
Viimeisin ja ehkä oleellisin näistä on itse vaatimus noudattaa näitä 
sääntöjä vilpittömällä rehellisyydellä silloinkin, kun se menee tutkijan 
omien etujen edelle. Kielentutkimus, kuten muukin tutkimus, kuuluu 
yhteisen edun piiriin, eli viime kädessä tieteellisestä tiedosta tulisi olla 
yhteiskunnan jäsenille hyötyä eikä haittaa. Sekä tutkimuseettinen arki- 


päivän etiikka että laajan vastuun etiikka (ks. Johdannon luku 4 tk.) ovat 
osa tätä koodistoa, jonka tavoite on taata, että tiede todella tuottaisi niin 
tutkimuksen kuluessa kuin sen lopullisessa muodossa, tieteellisenä tie- 
tona, enemmän hyvää kuin pahaa. 
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1. Uskomuksen muodostamisen tapoja 


2. Tieteellisten perustelujen muodostamisen tapoja 


formaalitieteet reaalitieteet 


3. Kielen ontologinen taustateoria 


totuusteoriat 


4. Metodologinen asemoituminen 


5. Tutkimuksen looginen rakenne 


6. Etiikka 


Kuvio 14. Etiikka kuuluu tutkimuksenteon käytäntöön. 


VIITTEET 


1 Nominalismin mukaan on olemassa vain reaalisia olioita, ts. teoreettisilla käsitteillä ei 
ole vastinetta reaalimaailmassa. Nominalismi on siis ontologinen kanta (mitä maail- 
massa on). Samoin instrumentalismi kieltää teoreettiset oliot ja pitää niitä tai niitä 
nimeäviä termejä vain enemmän tai vähemmän onnistuneina välineinä tieteellisessä 
käsitteenmuodostuksessa. Instrumentalismi on tieteenfilosofinen kanta. (Ks. Tieteen 
termipankki s.v. nominalismi, instrumentalismi.) 


2 Tietoteoria ja epistemologia ovat synonyymejä (ks. Lammenranta 1993). 

3 Toisenlaisia jakoja ovat esimerkiksi luonnontieteet vs. ihmistieteet ja selittävät tieteet 
vs. ymmärtävät tieteet (ks. esim. Niiniluoto 1980). 

4 Aiheesta keskustelivat Virittäjässä 1972—1975 Esa Itkonen, Esa Saarinen, Bengt-Olof 
Ovarnström sekä Oiva Ketonen. 
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5 Apriori tarkoittaa ennen kokemusta ja a posteriori kokemuksen jälkeen. Matemaattiset 
teoriat ovat analyyttisia a priori, mutta teoreettisen fysiikan matemaattiset teoriat sitä 
vastoin saavat vahvistusta tai kumoutuvat uuden evidenssin myötä. Esimerkiksi Higgsin 
bosoni vahvisti hiukkasfysiikan standardimallin. A priori on siis totuusteoreettinen ter- 
mi, joka viittaa proposition totuuden joko kumoutuvaan tai pysyvään luonteeseen. 2 + 
2=40na priori (tai apriorisesti) tosi. Sen sijaan Matin tieto siitä, että hänen nimensä 
on Matti, ei ole a priori totta, vaikka Matilla ei ole tarvetta katsoa passiaan tietääkseen, 
mikä hänen nimensä on. 

6 "If they are known to be true, they must be unfalsifiable, which means that they are 
non-empirical and thus in some sense a priori” (Itkonen 1997, 8-9). 

7 Postpositivismissa ajateltiin vuosisadan alussa, että välittömästi havaittavaa nimeävät 
termit olisivat ns. semanttisia partikulaareja ja siten ongelmattomia. Filosofinen tutki- 
mus kuitenkin osoitti, että havainto on teoriapitoista (ks. Johdannon luku 3 tk.). 


8 Ilmaisu ”kieltää lause” on käytössä logiikassa ja tarkoittaa, että jos A on tosi, niin ei-A 
ei samanaikaisesti voi olla tosi. Kysymys siitä, mitä tällaiset ristiriitaisuudet teorian 
sisällä tai teorian ja aineiston välillä tarkoittavat, on yksi tieteenfilosofisen tutkimuk- 
sen kohde. Naiivi induktivismi ja naiivi falsifikationismi esittivät, että yksi kieltolause 
kaataa koko teorian tai hypoteesin. Kehittyneemmät tieteenfilosofiset kehykset yleensä 
tutkivat kieltolauseita, niiden suhteita ja muita merkitysrakenteita kokonaisuuden näkö- 
kulmasta. 

9 "A theory is falsifiable [- —] if there exists at least one non-empty class of homotypic 
basic statements which are forbidden by it, that is, if the class of potential falsifiers is 
not empty” (Popper 2002 [1934], 95). 

10 Terminologian teoriassa perinteistä yksimerkityksisyyden vaatimusta on myös kritisoitu 
(ks. esim. Pearson 1998, 7; Temmerman 2000, 219). 

11 Ks. tarkemmin http://www.tenk.fi/. 

12 Poikkeuksen muodostavat mahdollisesti idiolektit eli yksilökielet sekä sellainen vainotun 
tai syrjityn kieliryhmän kielitieto, jolla voi olla poliittisia seurauksia (ks. Johdannon luku 
4 tk.; Konstenius 2014). 
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Johdannon luvussa 2 käsiteltiin tieteellisen menetelmän yleisiä ehtoja. 
Tämä luku jatkaa siitä kielentutkimuksen monimenetelmäisyyteen ja 
sen metateoreettisiin perusteisiin. Yleisesti monimenetelmäisyys on sitä, 
että tieteenalalla käytetään useita eri metodeja ja näkökulmia tutkimus- 
kohteen erilaisten ominaisuuksien selvittelyyn. Tämä on luonnollista 
kielen kaltaisen monimutkaisen ilmiön tutkimisessa. Käsitteellisenä 
erontekona on hyvä tiedostaa, että tässä luvussa avattava yksittäisen tie- 
teenalan monimenetelmäisyys on eri asia kuin yksittäistutkimuksen 
monimenetelmäinen tutkimusasetelma (engl. mixed methods). Se on 
myös eri asia kuin metodologinen pluralismi, joka on normatiivinen 
tieteenfilosofinen kanta sille, että tieteessä tarvitaan erilaisia malleja, seli- 
tyksiä tai metodeja. Tämän luvun päämääränä ei ole tarjota perusteellista 
kuvaa tieteenfilosofiasta (nyky)kielentutkimuksessa, vaan tarkoituksena 
on esittää yleisiä aihepiiriin kuuluvia teemoja. Tämän luvun tavoitteena 
on selkeyttää kielitieteelliseen tutkimusasetelmaan, metodiin ja teorian- 
muodostukseen vaikuttavia taustaoletuksia. Frilaiset kielen olemusta ja 
tiedonhankintaa koskevat uskomusjärjestelmät ohjaavat välttämättä sitä, 
miten tutkimus asemoituu suhteessa kohteeseensa ja miten tutkimus- 
käsitteistö valitaan ja miten sitä sovelletaan. Monimenetelmäistä 
tutkimusalaa koskevat myös jotkin sellaiset kielentutkimuksen luonteen 
taustaoletukset, joita on mielekästä selventää johdannon tässä luvussa. 
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3.1. Kielikäsitykset lähtökohtana: esimerkkinä kieltä ei ole 
-teesi 


Pysähdyttäessä havainnoimaan kieltä arkisessa elämässä huomataan, 
että valtaosa siitä koskee erilaisia ohimeneviä vuorovaikutus-, tarkoitta- 
mis- ja tulkintatilanteita, joissa varsinainen kielellinen toiminta (puhu- 
minen, viittominen tai kirjoittaminen) on usein vain yksi osa viestinnän 
kokonaismodaliteettia (eleet, ilmeet, katseet, asennot jne.). Näkemys 
kielellisestä toiminnasta osana ohimenevää, yhä uudelleen vain kerran 
koettavaa tapahtumien virtaa on saanut amerikkalaisen uuspragmatis- 
tin Donald Davidsonin (2006 [1986], 265) esittämään kielifilosofiansa 
perustaksi niin sanotun kieltä ei ole -teesin (engl. no language -thesis), 
jonka mukaan yksittäistä kieltä ei ylipäätään ole siinä merkityksessä 
kuin erityisesti filosofiassa on totuttu ajattelemaan (nim. sisäsyntyisenä 
järjestelmänä). Näin Davidson toteaa: 


I conclude that there is no such thing as a language, not if a language 
is anything like what many philosophers and linguists have sup- 
posed. There is therefore no such thing to be learned, mastered, or 
born with. We must give up the idea of a clearly defined shared struc- 
ture which language-users acguire and then apply to cases. And we 
should try again to say how convention in any important sense is 
involved in language; or, as I think, we should give up the attempt to 
illuminate how we communicate by appeal to conventions. (Davidson 


2006 [1986], 265.) 


Davidsonin mielestä kielessä on konventioita, mutta ne eivät määritä 
tai määrää merkityksiä kielenkäyttötilanteissa. Tulkinta liittää ilmai- 
suihin merkityksiä, jotka viittaavat maailmaan ja käsillä olevaan vuoro- 
vaikutustilanteeseen, ja juuri tässä mielessä vuorovaikutuksen kulku 
ja onnistuminen tai epäonnistuminen ei ole ennalta saneltu. Tulee 
pyrkiä olemaan ymmärrettävä ja ymmärtämään muita. Viestinnällinen 
selviäminen edellyttää kielellisen toiminnan onnistumista riittävässä 
määrin. Ymmärrystä tai onnistumista ei kuitenkaan luo mikään en- 
nalta asetettu sääntö tai konventio vaan alati uudistuvissa yksittäisissä 


106 MARKUS HAMUNEN JA REETTA KONSTENIUS 


vuorovaikutustilanteissa tilapäiset, ohimenevät ja vastavuoroiset arvauk- 
set puhekumppanien keskinäisistä intentioista. Tähän liittyy hänen kä- 
sitteensä radikaalista tulkinnasta, joka viime kädessä luo kommunikaa- 
tion ja kielen merkitykset. Tätä jatkuvaa intentioiden arvailua Davidson 
kutsuu nimellä passing theory, ohimenevien tilapäisten oletusten teoria. 
(Ks. myös Seppänen 2004, 32-59.) Kuvio 15 pyrkii havainnollistamaan 
tätä tilannetta. 


4 
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Kuvio 15. Kielen arkinen tilapäisten oletusten teoria ja kielen eri abstrakteja ole- 
mustyyppejä. 


Ihmisten arkisessa elämänvirrassa kielellinen vuorovaikutus on kuvion 
15 ilmentämää toimintaa ajassa. Musta pallo kuvaa yksilöä, jonka kielel- 
linen toiminta ja käyttäytyminen on aikapaikkaista ja ehdoiltaan ja edel- 
lytyksiltään alati muuttuvaa ja uudistuvaa. Vuorovaikutuksen kannalta 
tavoitteena on tulla ymmärretyksi ja ymmärtää. Useimmiten kielellä 
on lähinnä tällainen yksilöiden välinen välinearvo tai välitön käyttöarvo 
tilanteisesti. Sillä pyritään selviämään arjen tapahtumissa. Tällaisen toi- 
minnan voi hahmottaa kieltä ei ole -teesin mukaisesti. 

Kuitenkin kielentutkimuksen perinteessä kieltä on tutkittu muuten- 
kin kuin aikapaikkaisena toimintana ja käyttäytymisenä. Esimerkiksi 
kieli on voitu nähdä yksilön sisäistämänä mentaalisena järjestelmänä 
tai yksilöiden yllä vallitsevana sosiaalisena konventiona (kielen mentaa- 
linen ja sosiaalinen taso kuviossa 15). Myös kielen eri olemusmuotojen 
keskinäisiä suhteita on voitu pohtia. Tällöin kielestä, sen olemuksesta ja 
näistä saatavasta tiedosta tehdään erilaisia oletuksia. Näiden oletusten 
kokonaisuus muodostaa kielen olemusta kuvaavan käsitejärjestelmän. 
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Kielentutkimuksen metateorian tehtävä on muun muassa tehdä selkoa 
tällaisista kielen teorioista. 

Kieltä ei ole -teesi edustaa tässä yhtä esimerkinomaista näkemystä 
kielestä eli kielikäsitystä. Se osoittaa, että kieleen voidaan suhtautua hy- 
vin monella eri tavalla, jopa kieltäen se sellaisena kuin kielentutkimus 
on kieltä perinteisesti hahmottanut.' Se on myös hyvä muistutus sii- 
tä, että kielentutkimuksella ei ole mitään suoraa ja välitöntä suhdetta 
tutkimuskohteeseensa, vaan erilaiset teoriat, suuntaukset ja metodiset 
toimintatavat tuovat esiin kielestä eri puolia tarkasteltavaksi. Ne sekä 
objektivoivat että kuvauksellaan luovat kielellisten ilmiöiden yleispiirteitä 
(ks. Määttä 2000a, 216—218; 2000b). Samalla niiden sisään rakentuu 
jokin teoreettinen näkemys kielellisestä todellisuudesta, mikä on tutki- 
muksessa hyvä tiedostaa. Kieltä ei ole -teesin virike kielentutkimukselle 
lienee siinä, että se pakottaa pohtimaan kohteen ja kuvauksen, empii- 
risyyden ja teoreettisuuden, kielellisen ilmiön ja kuvausterminologian 
jne. välistä suhdetta tutkimusta tehtäessä. Davidsonin näkemys, että kie- 
len käsite voi johtaa tutkimusta harhaan on myös monimenetelmäistä 
kielentutkimusta ajatellen tärkeä aspekti, jota avataan seuraavaksi. 


3.2. Ontologia ja kielentutkimus 


Tutkimus ei ole koskaan teoriatonta. Metodin käyttö ja perustelu 
ovat aina sidoksissa oletuksiin todellisuuden luonteesta. Metodilla on 
siis käytännöllis-teknisen luonteensa lisäksi teoreettinen perustansa. 
Esimerkiksi 1970-luvulla keskusteltiin kiivaasti siitä, mikä on kieli- 
tieteessä kielijärjestelmän sisäsyntyisyyden tieto-opillinen asema eli 
toisin sanoen, mikä on generatiivisen transformaatiokieliopin luonne. 
1980-luvun lopulla tällainen metateoreettinen keskustelu kehittyi ja 
väljentyi vastakkainasetteluksi funktionalistisen ja formalistisen koulu- 
kunnan välillä. Esimerkiksi Lakoff (1987) ja Chomsky (1989) esittivät 
kummatkin sen saman käsityksen, että eri koulukuntien näkemys kie- 
len ontologiasta tai olemuksellisuudesta ja tutkimusmetodologia imp- 
likoivat toinen toisiaan. Myös esimerkiksi Langackerin (1987) mukaan 
hänen näkemyksensä kognition toiminnasta olisi suoraan sidoksissa 
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niihin kognitiivisiin tutkimuskäsitteisiin, joilla hänen käsityksensä mu- 
kaan kieltä tuli tutkia. Chomsky (1986) taas puolusti uusia formaalisia 
työkaluja omassa koulukunnassaan esittämällä saman argumentin. 

Nämä keskustelut ja niissä esitetyt kysymykset vaikuttavat ehkä nykyi- 
sen suomalaisen metateoreettisen keskustelun näkökulmasta vanhentu- 
neilta, sillä empiirisellä ja funktionaalisella kielentutkimuksella on ollut 
vahva perinne Suomessa. Maissa, joissa generativismi on edelleen vahvas- 
ti esillä kielentutkimuksessa, debatti on yhä ajankohtainen. Esimerkiksi 
Scholz, Pelletier ja Pullum (2016) esittelevät kielitieteen filosofiaa erityi- 
sesti generativismin näkökulmasta. He jakavat kielentutkimuksen har- 
joittajat kolmia: essentialisteihin, emergentisteihin ja eksternalisteihin. 
Näitä suuntauksia määrittävät asenteet tutkimuskohteeseen, tutkimus- 
päämääriin ja tutkimuksen tuloksiin. Phillipsin (2009) mukaan näiden 
koulukuntien välillä ei ole aitoa filosofista keskustelua: ”[d]ialogy between 
adherents of different approaches is alarmingly rare”. 

Onpa kielitieteen erilaisista jaotteluista samaa tai eri mieltä, ne ku- 
vaavat kieltä koskevien peruskäsitysten eli ontologian ja metodologian 
välistä kiinteää suhdetta. Ilman käsityksiä kielen olemuksesta ei voida 
pätevästi määritellä ja kuvata, miten tätä olemusta tutkitaan, saati sitä, 
mitä ja miten siitä pyritään tietämään. Oletukset tutkimuksen kohteesta 
johtavat erilaisiin tutkimusasetelmiin, metodeihin ja tulosten tulkin- 
toihin. Kielitiede on monimenetelmäinen ala, ja jokaiselle tutkimus- 
näkökulmalle on tarkoituksenmukainen käyttö- ja sovellusalansa. Jo- 
kainen tässä teoksessa esitelty metodi tuottaa omasta näkökulmastaan 
rikasta ja kokonaiskuvaa täydentävää tietoa kielestä. Kielitiede voidaan 
siis nähdä Scholzin, Pelletierin ja Pullumin (2016) esitystä hetero- 
geenisempana ja yhtenäisempänä. Tiukkoihin käytännön tutkimus- 
työtä rajoittaviin rajanvetoihin ei ole välttämättä tarvetta, mutta erilais- 
ten erontekojen heuristista arvoa tieteenalan kokonaishahmottamisen 
kannalta ei myöskään voi väheksyä. 

Kielitieteen tieteenalan monimenetelmäisyyttä ajatellen on kuiten- 
kin mielekästä ymmärtää kieli ilmiönä, jota voi käsitteellistää eri näkö- 
kulmista (ks. Arppe & Järvikivi 2007). Kun kieltä kuvataan eri näkö- 
kulmista ja lähtökohdista (esim. kuvion 15 kielen eri tasot), kohteen 
kuvauksetkin eroavat toisistaan. Kielitieteessä eri lähestymistavat eivät 
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siten ole lähtökohtaisesti toisensa poissulkevia, kuten saatetaan ajatel- 
la, vaan usein toisiaan täydentäviä. Näennäiset ristiriitaisuudet mallien, 
teorioiden ja kuvaustapojen välille syntyvät tavallisesti silloin, kun yleis- 
tetään yhdestä tutkimuksesta tai tutkimussuuntauksesta koko kieleen 
eli väitetään, että yksi näkökulma ilmiöön määrittää koko kielen. Tällöin 
tutkimusnäkökulman ja metodin aiheuttamat vaikutukset kohteen käsit- 
teellistämiseen ovat hävinneet näköpiiristä. Kokonaisuutta tavoitteleva 
systeemiteoreettinen näkökulma monimenetelmäisyyteen on helppo 
ymmärtää elefantti-faabelin kautta: siinä kolme sokeaa miestä päätyy 
ilmiriitaan siitä, mikä on elefantti. Kun yksi on tarttunut kiinni hännäs- 
tä, toinen jalasta ja kolmas kärsästä, tuntuu, että kuvaillaan eri asioita. 
Kielitieteessä samoin kielitajun varainen autonominen lingvistiikka, 
keskustelutallenteiden varainen vuorovaikutuslingvistiikka tai laajoihin 
tekstiaineistoihin perustuva korpustutkimus eivät poissulje toisiaan 
vaan lisäävät kukin, tarkoituksenmukaisesti sovellettuina, omasta näkö- 
kulmastaan tietoa kielestä. 

Tutkimuksen näkökulman tiedostamisessa on oleellista ymmärtää 
oman tutkimuskäsitteistön sidoksisuus niihin ontologisiin oletuksiin, 
jotka tutkimuksen aikana tehdään. Tämä ei ole kielitieteelle erityinen 
ominaisuus vaan pätee yleisesti tieteelliseen tutkimukseen. Kielitiede 
ei siten tältä osin eroa muista tieteistä, vaan eri tieteenalat ovat tässä 
suhteessa samankaltaisia. Kuten aiemmin esitimme (ks. Johdannon 
luku 2.5. tk.), tieteellinen tutkimus on aina teoriapitoista; ”puhdas- 
ta” havaintoa ei nykykäsityksen mukaan saavuteta, vaan tutkimuster- 
mien merkityksen määrää käytössä oleva taustateoria. Ouinen (1951) 
holistisen merkitysteorian klassikko esittää, ettei riippumatonta väite- 
lausetta voi verrata todellisuuteen, vaan taustalla on aina jokin kohe- 
rentti uskomusjärjestelmä. Niinkin yksinkertainen ja perustava kieli- 
tieteellinen käsite kuin merkki saa erilaisen merkityksen de Saussuren, 
Peircen, Wittgensteinin ja Chomskyn kirjoituksissa. Jos taustalla olevat 
uskomusjärjestelmät ovat erilaisia, väitelause ”kieli on merkkien systee- 
mi” tarkoittaa eri asioita. Kielentutkijan on siten oleellista pohtia, missä 
merkityksessä hän käyttää omia peruskäsitteitään, millaisia sidoksisuuk- 
sia erilaisiin uskomusjärjestelmiin niillä on ja mitä loogisia implikaa- 
tioita eri merkityksillä näiden sidoksisuuksien myötä on. Hyvä on myös 
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pohtia sitä, millä tavalla oma määritelmä kohteesta mahdollisesti rajaa 
tai sulkee pois jonkin toisen alan näkökulmia kielentutkimukseen. 
Tutkimuksen lähtökohtaisella teoriasidonnaisuudella on erilaisia seu- 
rauksia. Reaalitieteissä, joihin kielentutkimuskin pääosin kuuluu (ks. Joh- 
dannon luku 2.3. tk.), on tutkimuksen kuluessa otettava eksplisiittisesti 
tai implisiittisesti kantaa siihen, millaiseen todellisuuden alueeseen tut- 
kimus kohdistuu (ks. kuviossa 15 kielen eri olemustyypit). Tutkimuksen 
kohde hahmotetaan osana laajempaa todellisuutta. Tutkimusasetelmaa 
ei voi suunnitella, ellei ole tällaista esiymmärrystä ja ennakkokäsitystä sii- 


tä, mikä tutkimuskohde yleispiirteiltään on, miten se liittyy maailmassa 
muihin ilmiöihin ja miten siitä voi saada tieteellistä tietoa. 

Kielitieteessä ontologialla on erityisen merkittävä rooli: kielentutkijan 
on muodostettava käsitys kahdesta eri kielestä, joista toinen on tutki- 
muskohde, luonnollinen kieli eli objektikieli, ja toinen tutkimuskohdetta 
koskeva kielellinen esitys, tieteen kieli eli metakieli. Kun tutkijan on 
monilla muilla aloilla ainoastaan vastattava kysymykseen, mikä on tie- 
teen kielen ja todellisuuden suhde, kielitieteilijän on vastattava myös 
kysymykseen, onko tieteen (meta)kielellä ja luonnollisella, tutkittavalla 
objektikielellä sama ontologia ja mikä ontologia näillä kahdella mahdol- 
lisesti on. Jos kielentutkija esimerkiksi esittää, että tieteen kieli ei viittaa 
todellisuuteen, hylkää hän myös samalla usein tieteellisen realismin (ks. 
Johdannon luku 2.2. tk.) ja totuuden korrespondenssiteoriat (ks. Johdan- 
non luku 2.4. tk.), eivätkä nämä tieteenfilosofiset taustateoriat voi tällöin 
olla osa tutkimuksen teoreettista viitekehystä. Johdannon luvussa 3.2.2. 
tarkastellaan pintapuolisesti käsitteitä laki ja selitys erityisesti suhteessa 


realistiseen todellisuuskäsitykseen, jotta lukija saisi paremman kuvan 
siitä, millaista epäkoherenssia tai millaisia loogisia ristiriitaisuuksia ai- 
van tavalliset kielitieteen termit voivat tutkimuksen kuluessa aiheuttaa. 


3.2.1. KIELEN OLEMUS EI OLE SAMA KUIN KIELEN ONTOLOGIA 

Tutkimus katsoo kohdettaan ja käsitteellistää sitä aina tietystä näkö- 
kulmasta. Eri näkökulmat, metodit ja aineistot havaitsevat siten ilmiöis- 
tä eri puolia. Juuri yksittäisten tutkimusten näkökulmasidonnaisuus 
tekee monimenetelmäisestä kielentutkimuksesta arvokkaan. Siksi 
kaikkia menetelmiä tarvitaan (ks. Arppe & Järvikivi 2007a). Monen 
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tutkimusnäkökulman rakentaminen yhteen kohteeseen ei kuitenkaan 
implikoi, että kohde olisi ontologisesti moninainen, vaan että tutkimus 
on rikasta. Toisin sanoen erilaiset tutkimuskohteen tasot, rakenteet ja 
suhteet ilmenevät erilaisille tutkimusnäkökulmille usein erilaisina, ja 
tutkimuksissa käytetään tällöin usein myös eri käsitteitä. 

Ajatus, että kieli on systeeminen kokonaisuus, on yleensä tuttu 
kielitieteilijälle. Termi, sääntö, konventio, muuttuja tms. voidaan vii- 
me kädessä kuvata vain toisten termien, sääntöjen, konventioiden 
ja muuttujien avulla, jotka siis yhdessä muodostavat jonkinlaisen 
kokonaisjärjestelmän. Kuvio 16 havainnollistaa puhutun ja viitotun kie- 
len olemuksellista moninaisuutta kolmen muuttujadimension avulla 
(ks. myös Karlsson 1982, 49). Muuttujat ovat tyypillisiä esimerkiksi pe- 
rinteiselle (labovilaiselle) sosiolingvistiselle tutkimukselle, ja ne ilmen- 
tävät esimerkinomaisesti kieltä systeeminä, jossa tutkitut muuttujat tai 
tekijät muodostavat rajatun selitysavaruuden jostakin kielen ilmiöstä. 


muodollinen tilanne 

korkea ikä 

korkea sos. status 

aluemurteet 


ryhmäkieli yksilökieli 


epämuodollinen tilanne 
alhainen ikä 
alhainen sos. status 


mi ttt ieee wa  o= — 
— — am m 
"D qa» 


Kuvio 16. Puhutun ja viitotun kielen vaihteluun vaikuttavia muuttujia (mukaillen 
Karlssonia [1982]). 


Kieltä voi tieteessä tarkastella esimerkiksi aluemurteiden, perinteis- 
ten sosiolingvististen muuttujien (sukupuoli, ikä, sosiaalinen luokka) 
ja ryhmäidentiteetin kannalta. Kukin muuttujaulottuvuus luo valitun 
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näkökulman ja usein myös käytettyjen metodien myötä hahmottaa 
oman, jollain tavoin rajoittuvan kielimuotonsa: esimerkiksi Turun seu- 
dun murre, kulosaarelaisen korkeakoulutetun kieli, Liisin (synt. 1938 
Leppävirta) kieli tai katutanssiryhmän kieli. Tällainen hahmotus luo 
mitä moninaisimpina risteävien ja limittyvien kielen muotojen tai sys- 
teemien verkoston, jossa mikään kohta tai leikkaus yksinään ei edusta 
kieltä sinänsä ja holistisesti. Kun kielen ilmentymien (esim. kirjoitettu 
ja puhuttu kanava) ja muuttujien limittymisen lisäksi ilmaustapojen va- 
linta ajassa ja kielellinen toiminta otetaan mukaan yhtenä vaikuttavana 
tekijänä, osoittaa se, että on hyvin vaikea hahmottaa mitään itsenäistä 
ja autonomista yksikköä kielessä tai rajautuvaa kielioliota, esimerkiksi 
suomen kieltä (ks. Johdannon luku 3.1. tk.). 

Toisinaan kielentutkimuksen metodologiaa käsittelevässä kirjalli- 
suudessa esiintyy ontologisen pluralismin yhteydessä Popperin (1978) 
kolmen maailman malli. Popperin mallissa lyhenteet M1, M2 ja M3 viit- 


taavat todellisuuden kolmeen erilliseen maailmaan: fysikaaliset oliot ja 
tapahtumiset (Mr), mentaaliset oliot ja tapahtumiset (M2) sekä ihmisten 
ja yhteisöjen ajattelulla tuotetut sisällöt (M3, esim. tieteelliset teoriat, 
sosiaaliset instituutiot, taideteokset) (ks. esim. Itkonen & Pajunen 2010, 
11-12). Mallia tarkasteltaessa on mielekästä kuitenkin kiinnittää huomio- 
ta siihen, että malli toimii Popperin kriittisen rationalismin perustana? 

Popperin mallia käytetään heuristisesti myös ontologialtaan monis- 
tisissakin teorioissa. Esimerkiksi fenomenologiset teoriat esittävät, että 
Mı, M2 ja M3 ovat olemuksellisen ilmenemisen tasoja niin ihmisel- 
le kuin myös tieteessä. Myös foneettiset mittaukset tai kielellistä aivo- 
toimintaa kuvantavat menetelmät edustavat erilaisia tarttumapintoja 
kieleen, ja niitä voi kuvata Popperin Mr:n kautta tai jonkin muun kil- 
pailevan käsitteistön avulla. Teorialle, jossa on fenomenologinen epis- 
temologinen näkökanta, kielen keskenään erilaisten olemustyyppien 
ja ilmiöiden tutkiminen ei siten tarkoita erillisten ontologisten tasojen 
tutkimusta. 

Monen näkökulman rakentaminen tutkimuskohteeseen ei siten suo- 
raan implikoi, että kohde olisi ontologisesti pluralistinen vaan että ihmi- 
sen rakentama kokemusmaailma siitä on rikas. Toisin sanoen erilaiset 
maailmat, tasot, rakenteet, elämänmuodot ja suhteet ilmenevät ihmiselle 
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ja erilaisille tutkimusnäkökulmille tutkimuksen eksplikoinnin myötä. 
Ontologinen monisti, niin fenomenologi kuin materialistikin, voi siten 
kannattaa tutkimusmetodien moninaisuutta tieteellisen tiedon kartutta- 
misen välineenä. Tällaisen näkemyksen Popperin kolmeen maailmaan 
esittävät kielentutkimuksessa esimerkiksi Lakoffin ja Johnsonin (1999) 
ruumiillinen realismi ja prototyyppiteorian taustalla oleva neurofenome- 
nologia (Varela, Kabat-Zinn, Rosch & Thompson 2017). 

Suomalaisessa tieteenfilosofiassa (esim. Niiniluoto 1990) ja kieli- 
tieteessä (Itkonen 1997, Määttä 2000c) vallalla ollut ontologinen näke- 
mys on vanhastaan ollut pluralistinen. Nykytutkijan on kuitenkin hyvä 
tiedostaa, että nykyisin juuri pluralismi tieteenfilosofisena näkemyksenä 
on haasteiden edessä, ja sitä näyttää olevan erittäin vaikea puolustaa. Joh- 
dannon luvussa 2 on käsitelty tähän metafyysisen filosofian kehitykseen 
vaikuttaneita seikkoja, kuten vaikeuksia selittää substanssien väliseen 
interaktioon liittyvää kausaalista tai muuta yhteyttä. Ontologiset pluralis- 
tit (esim. Putnam, Hirsch) usein esittävät, että on olemassa eri kieliä, joi- 
den avulla eri olemassaolon tyyppejä voidaan esittää, ja että nämä kielet 
voivat kuvata maailman tosiasioita periaatteessa yhtä hyvin. Ontologiset 
kysymykset olisivat siis pääasiassa kielellisiä, ja ne palautuisivat kielelli- 
siin valintoihin. Miten tällainen näkemys soveltuu kielitieteeseen itseen- 
sä ja mitä implikaatioita sillä olisi kielentutkimuksen metodologiassa? 
Tervetullutta olisikin uusi 2000-luvun kielitieteen filosofia, joka ottaisi 
huomioon pluralismin sudenkuopat ja esittäisi uudenlaista koherenttia 
kuvaa kielestä ja sen monimenetelmäisestä tutkimuksesta. 


3.2.2. TODELLISUUSKÄSITYKSEN VAIKUTUS TUTKIMUKSEEN: 
LAKI JA SELITTÄMINEN KIELENTUTKIMUKSESSA 

Vastaus esimerkiksi kysymykseen ”Onko kielen normi samaa vai eri 
substanssia kuin materiaalinen maailma?” määrittää kielentutkijan posi- 
tiota suhteessa siihen, koskevatko kieltä erityiset omat tutkimusmetodit. 
Teoriat voidaan lisäksi jakaa sen suhteen, miten ne vastaavat kysymyk- 
seen, mikä on todellisuuden suhde tietoisuuteen: Onko kielen normi 
olemassa silloinkin, kun yksikään ihminen ei sitä ajattele, vai onko se 
riippuvainen tietoisuudesta? Löydetäänkö kielen piirteet todellisuudesta 
vai konstruoidaanko ne? Vastaukset määrittävät käsityksiä siitä, miten 
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kieltä tulisi tutkia. Tässä luvussa käsitellään käsitteitä laki ja selittäminen 
kielentutkimuksessa suhteessa todellisuuskäsityksiin. 

Käsitteellä laki voidaan viitata 1) luonnollisen maailman fysikaalisten 
ilmiöiden kausaaliseen selittämiseen eli seuraantolakeihin, 2) eksperi- 
mentaalisiin lakeihin (esim. veden kiehumispiste), 3) empiirisiin lakei- 
hin (esim. Galilein putoamislaki), 4) teleologisiin selityksiin (A teki B:n, 
koska tavoitteli C:tä), 5) ilmiöiden invariantteihin muuttumistapoihin 
(esim. Darwinin luonnonvalinta), 6) funktionaalisiin riippuvuus- 
suhteisiin (mentaalisia toimintoja ei ole ilman muutoksia fysikaalises- 
sa todellisuudessa), 7) kvalitatiivisiin lakeihin (korpit ovat mustia), 8) 
yhteiskunnan velvoittaviin säädöksiin ja juridiseen säätelyjärjestelmään 
(esim. Suomen rikoslaki), 9) teoreettisiin lakeihin ja niitä kuvaaviin 
lauseisiin (”Samalla aineella samassa tilassa on samat ominaisuudet”) 
ja 10) universaaleihin piirteisiin (esim. kaikissa kielissä on vokaaleja). 
Termillä laki voidaan siis viitata hyvinkin erilaisiin ilmiöihin. Yleensä 
erilaiset tieteenfilosofiset teoriat pyrkivätkin selittämään, miten nämä 
erilaiset laki-käsitteeseen kuuluvat ilmiöt liittyvät toisiinsa. Ne nimeävät 
käsitteet selvyyden vuoksi usein eri termein. 

Ottaen huomioon, että käsite laki ja siihen liittyvä termistö ovat kiis- 
tatta tieteenfilosofian hankalimpia käsitteitä, joita on jo Aristoteleesta 
asti käsitelty, on varsin valitettavaa, että vielä 2000-luvulla ei ole perin- 
pohjaista kielitieteen filosofiaa, jossa olisi käsitelty erilaisten laki-kasit- 
teiden käyttöä kielentutkimuksessa. Keskustelu lainomaisuuksien ja 
säännönmukaisuuksien luonteesta kielentutkimuksessa johtaa usein 
sellaiseen virhepäätelmään, että laki-termillä olisi vain yksi merkitys 
(esim. 'deterministinen luonnonlaki’) tai että vain luonnontieteissä olisi 
olemassa empiirisiä lakeja ja ihmistieteissä pelkästään hermeneuttista 
tulkintaa. (Ks. Tieteen termipankki s». laki.) 

Tiedostamattomat näkemykset todellisuuden luonteesta nivoutuvat 
usein tutkijan huomaamatta tutkimuskäsitteistöön ja ohjaavat uskomuk- 
sia ja päätelmiä tutkimuksen kohteesta. Käyttämällä yhtä tai toista ter- 
miä hän voikin tietämättään vastata seuraavanlaisiin kysymyksiin: Mikä 
on tieteellisen selityksen rakenne? Onko selittäminen ja ennustaminen 
sama asia? Onko luonnontieteen selitys sama kuin ihmistieteen seli- 
tys? Miten selitysvoimaa voi arvioida? Mitkä ovat lain lainomaisuuden 
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tunnusmerkit? Mitä eroa on tosiasioiden selittämisellä ja lakien selittä- 
misellä? Onko olemassa todennäköisyyksiä koskevia lakeja? 

Lait voidaan karkeasti jakaa a) seuraantolakeihin ja b) yhteen- 
liittymislakeihin. Deterministiset lait, kuten ne, jotka Newtonin meka- 
niikka ilmaisee, ovat seuraantolakeja. Laki ilmaisee syyn ja seurauksen, 
jotka toteutuvat aina standardiolosuhteissa. Tilastolliset yhteenliittymis- 
lait, esimerkiksi perinnöllisyyslait, taas kertovat, millä todennäköisyydellä 
jokin ilmiö tapahtuu (esim. lapsi on 51 %:n todennäköisyydellä poika). 
Seuraantolait kuvaavat siis tapahtumien ja niiden kulun säännönmukai- 
suutta, yhteenliittymislait joidenkin piirteiden, ominaisuuksien tai suh- 
teiden säännönmukaista yhteenliittymistä (ks. Niiniluoto 1983, 229-236). 

Termeillä lainomainen ja satunnainen erotellaan sellaiset lauseet, joil- 
la on jokin laki-käsitteen määritelmään kuuluva piirre, ja ne lauseet, 
jotka ovat satunnaisia. Termillä lainomainen viitataan sellaisiin lausei- 
siin, jotka johtavat suoraan tai välillisesti informatiivisiin yleistyksiin, 
kuten ”huoneen dimensiot ilmaisevat, kuinka paljon happea voi tässä 
tilavuudessa olla”. Myös esimerkiksi luonteeltaan tilastolliset seuraanto- 
lait (esim. todennäköisyys saada rahanheitossa kolme kruunaa peräk- 
käin on 1/8) tai universaalit yhteenliittymislait (aggressiiviset henkilöt 
ovat väkivaltaisia) ovat lainomaisia. Sen sijaan esimerkiksi lause ”kaikki 
koululuokassa ovat syntyneet vuoden 1990 jälkeen” voi ilmaista toden 
yleistyksen, mutta se ei ole lainomainen vaan satunnainen eli kontin- 
gentti (ks. Johdannon luku 2.3. tk.). Tieto, että huoneessa on tiettyyn ikä- 
ryhmään kuuluvia ihmisiä, ei johda sellaisiin yleistyksiin, jotka lisäävät 
tietoa huoneista tai ihmisryhmistä yleensä. 


Termillä lainomainen voidaan myös viitata siihen, että taustateoriassa 
ei uskota, että deterministisiä lakeja on ollenkaan olemassa, eli laki-ter- 
millä voidaan nimetä oikeastaan ainoastaan lainkaltaisia ilmiöitä (ns. 
ceteris paribus -käsitteestä (ks. Johdannon luku 2.5. tk.). Humelainen kä- 
sitys laeista on, että on olemassa vain tapahtumien tosiasiallisia yhteen- 
liittymiä. Ilmaus ”B seuraa A:ta” ilmaisee vain ja ainoastaan sen, että 
jotkin asiat ovat historiallisesti liittyneet yhteen. Popperinkaan (2002 
[1934]) mielestä aitoja seuraanto- tai kehityslakeja ei ole olemassa. Esi- 


merkiksi Niiniluodon (1990) mukaan lainomaisilla lauseilla on asteita. 
Voidaan siis kysyä, missä määrin jokin ilmiö on lainomainen. 
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Taulukossa 1 on käytetty Niiniluodon (1983, 204) jakoa seuraanto- 
ja yhteenliittymislakeihin, jotka vuorostaan voidaan jakaa teoreettisiin 
ja empiirisiin, deterministisiin ja tilastollisiin sekä kvalitatiivisiin ja 
kvantitatiivisiin lakeihin. Empiirisiksi laeiksi kutsutaan sellaisia lakeja, 
jotka voidaan todentaa havainto- ja kokemusaineistolla (esim. Galilein 
putoamislaki). Eksperimentaaliset lait ovat empiiristen lakien eräs ta- 
paus, sillä niissä on kokeellisesti mitattavissa olevia kvantitatiivisia 
käsitteitä (esim. veden kiehumispiste). Teoreettisilla laeilla viitataan ei- 
havaittaviin ominaisuuksiin. Deterministiset lait ovat usein dynaamisia 
välttämättömiä lakeja, ja tilastolliset lait vuorostaan kertovat, millä toden- 
näköisyydellä jokin asia tapahtuu. Niiniluodon (mp.) kaavio toimii heu- 
ristisena välineenä sen ymmärtämiseksi, että käsitteiden laki ja lainomai- 
suus alla pohditaan useita loogisilta ominaisuuksiltaan erilaisia ilmiöitä. 


C) C) E) E) 
deter- deter- tilastolli- tilastollinen 
ministinen | ministinen nen 
kvantita- kvalitatiivi- kvantita- kvalitatiivinen 
tiivinen nen tiivinen 

A) teoreet- 

seuraantolaki | tinen 

A) empiiri- | dynaami- 

seuraantolaki | nen nen laki 

B) yhteen- teoreet- aikissa Jos kielessa 

liittymislaki tinen uonnollisis- neutraali 

sa kielissä lausekejärjestys 
on vokaaleja on SOV, siinä 
ja konso- on ensisijaisesti 
nantteja. postpositioita. 

B) yhteen- empiiri- aikki korpit | Zipfin laki | äännelaki 

liittymislaki nen ovat mustia. 


Taulukko 1. Lait ja lainomaisuudet Niiniluotoa (1983, 204) mukaillen. 
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Kuten huomataan, lainomaiset ilmiöt voidaan karkeasti jakaa 16 luok- 
kaan. Näistä vain kaksi sisältää klassiset universaalit seuraantolait ja yksi 
dynaamiset lait, jotka useimmiten nimetään luonnonlaeiksi. Dynaamiset 
lait ilmaistaan ajallisena funktiona (esimerkiksi Galilein putoamislaki 
12 gt), ja ne muodostavat siten laki-kategoriassa erittäin pienen joukon. 
Vaikka taulukko 1 ei ole kannanotto Niiniluodon (1999) kriittisen tieteel- 
lisen realismin puolesta, tämä yksikertainen käsitteistö toimii hyvänä 
perustana keskustelulle kielitieteessä käytettyjen erilaisten yleistysten, 
säännönmukaisuuksien ja lakikäsitteistön ominaisuuksista. Taulukkoon 
1 on sijoitettu muutamia erilaisia kielitieteellisiä laki-käsitteitä siinä toi- 
vossa, että jako herättäisi vilkkaampaa keskustelua kielitieteen omasta 
lainomaisuuskäsitteistöstä. Taulukkoa 1 voi käyttää myös oman arki- 
tutkimuksen käsiteanalyysissa. Käsitteen käytön ala nimittäin kertoo 
myös sen, millaisia piirteitä ilmiöllä oletetaan olevan ja mikä siten on 
tyydyttävä ilmiötä koskeva tieteellinen selitys. 

Tieteelliset selitykset ovat yksi tieteellisen argumentaation muoto. 
Edellä luvussa 2 käsiteltiin tieteellisen argumentin rakennetta ja to- 
dettiin, että argumentti koostuu väitteestä ja perusteluista. Tieteelliset 
argumentit voidaan jakaa karkeasti kahteen perusluokkaan reaalitieteis- 
sä: 1) kuvauksiin, jotka kertovat, mitä maailmassa on, ja 2) selityksiin, 
jotka kertovat, miksi jokin asia on niin kuin se on. Kummassakin ta- 
pauksessa tieteellisen argumentin vaikuttavuus liittyy väitteen peruste- 
luihin ja näyttöön. 

Kielitieteessä kuvaamisen tavoite on kertoa, millainen kieli on, ja 
selityksellä tavoitellaan sitä, miksi kieli on, mitä se on. Kuvauksessa 
käytetään luokittavia metatermejä. Tavoite on yhtäältä a) kuvata reaali- 
todellisuuden kieli-ilmiöitä ja toisaalta b) pyrkiä kehittämään ja tarken- 
tamaan ilmiöitä nimeävien metatermien määritelmiä erilaisten aineis- 
tojen, esimerkkien ja uuden tieteellisen tiedon valossa. 


Kielitieteellinen kuvaus 


a) Kuvauksessa tavoitteena on kuvata reaalitodellisuuden kieli-ilmiöitä 
niin aivojen, kognitiivisten toimintojen, puheen, käytettävien merk- 
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kien, kielellisen toiminnan, kieliopin jarjestelmien kuin kirjoitetun 
kielen tasolla. 


b) Kielenkuvauksen tavoitteena on kehittää edelleen metateoreettisia 
luokitusjärjestelmiä niin, että ne kattavat tunnetut aineistot ja ilmiöt 
ja että ne luokittavat ilmiöitä mahdollisimman hyvin. 


Kielitieteellisten selitysten voidaan katsoa muodostavan yhden keskeisim- 
mistä tieteenalan tehtävistä: pelkkä onttinen luettelo (mm. kielessä on 
verbejä, substantiiveja jne.) ei ole tiedollisesti tyydyttävä. Kiinnostavaa on 
tietää, miten erilaiset kielen sisäiset ja ulkoiset ilmiöt liittyvät toisiinsa ja 
millaiset ilmiöt aiheuttavat tapahtumaketjuja kielessä ja kieliyhteisöissä. 
Tieteellisen vallankumouksen voidaan katsoa liittyvän juuri siihen, että 
ymmärrettiin, että selittävä tutkimus mahdollistaa ymmärtämisen ja tu- 
levien tapahtumien ennustamisen, kontrollin ja erilaiset teknologiat. 
Toisinaan tieteellinen selitys assosioidaan yksinomaan laki-käsittee- 
seen: ajatellaan, että tieteellisissä selityksissä on kysymys vain jonkin 
lain (yleensä dynaamisen luonnonlain) kuvaamisesta tai deduktiivis- 
nomologisesta selittämisestä (ks. subsumptioteoria ja DN-malli Joh- 
dannon luku 2.5. tk.). Ajatus, että jonkin tapahtumainkulun taustalla 


on invariantti (muuttumaton) universaali laki, on kuitenkin verraten 
uusi. Aristoteles, joka aloitti keskustelun tieteellisestä selittämisestä, 
esitti, että selitykset koskevat ilmiöiden substantiaalista invarianssia 
eli olemuksellista pysyvyyttä tai muuttumattomuutta. Aristoteelinen 
maailmankäsitys oli vallitseva aina valistusajan tieteelliseen vallan- 
kumoukseen eli 1600-luvulle asti. Aristoteelinen selittäminen on luon- 
teeltaan teleologista ja perustuu ajatukseen, että ilmiöillä on jokin es- 
senssi, niille ominainen luonne, ja siten tieteelliset selitykset kertovat 
erilaisten maailmaan kuuluvien olioiden pyrkimyksestä tavoittaa pää- 
määränsä, potentiansa (Kaila 1939; von Wright 1971). Tieteellinen selitys 
kuvaa ilmiön ominaisuuksien ja potentian syitä. 

Huomataan, että tieteellisellä selittämisellä on kiinteä suhde vallitse- 
vaan maailmankäsitykseen. Käsitys tieteellisen selittämisen luonteesta 
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onkin kehittynyt rinnakkain tieteen kanssa. Kun käsitys maailman luon- 
teesta muuttuu, muuttuvat myös käsitykset siitä, miten maailmassa ole- 
via suhteita selitetään. Taulukosta 1 huomataan, että käsite laki sisältää 
ainakin 16 kategoriaa. Nykyinen käsitys laeista on niin Aristoteleen kuin 
Galileinkin laki-käsityksiä laajempi. Nykyään lainomaisiksi ilmiöiksi 
ymmärretään myös erilaiset teoreettiset kvalitatiiviset ja kvantitatiiviset 
yhteenliittymislait ja -suhteet. 

Kielitieteen selityksillä on ollut joitakin alalle ominaisia piirteitä. De 
Saussuren strukturalismi on fonologian suhteen staattinen ja synkro- 
ninen mutta morfologian suhteen dynaaminen ja diakroninen. Kum- 
massakin tapauksessa ilmiö selitetään suhteessa siihen järjestelmään, 
jonka osa se on. Autonomisessa kielitieteessä kielen formaalia kuvausta 
on myös pidetty luonteeltaan selittävänä. Tavoitteena on ollut paljastaa 
luonnontieteellinen noominen ilmiö eli biologinen universaalikielioppi, 
joka selittäisi kielen rakenteita. Generatiivinen formaali kuvaus on siis 
luonteeltaan samalla selitys, koska se kertoo, millainen universaali inva- 
rianssi on johtanut johonkin kieli-ilmiöön. Hyvin samankaltainen selit- 
tävä suhde on kognitiivisella kielitieteellä suhteessa kognitioon. Kognitio 
selittää kielen rakenteita eli vastaa kysymykseen, miksi kieli on sellai- 
nen, kuin se kuvausten perusteella näyttää olevan. 

Kielitieteessä myös funktionaalisella selittämisellä on ollut tärkeä 
rooli. Funktionaalisessa selittämisessä jotain kielen ilmiötä koskevaan 
miksi-kysymykseen vastataan viittaamalla sen tehtävään eli funktioon 
(f) jossain laajemmassa kokonaisuudessa. Miksi sydän sykkii, tai miksi 
suomen kielen y-äänne esiintyy pyöreänä? Sydän sykkii, koska se pump- 
paa verta biologisessa systeemissä. Suomen y-äänne on pyöreä, jotta se 
erottuisi saman ääntymäpaikan laveasta i-äänteestä (Määttä 1994, 72). 

Funktionaalista selittämistä on toisinaan pyritty ymmärtämään suh- 
teessa aristoteeliseen teleologiseen selittämismalliin. Kielen rakenteen 
finaalisuus on tällöin yleistetty aristoteelisesta praktisesta syllogismista 
tiedostamattomaan ja kollektiiviseen toimintaan (Määttä 1994, 258). 
Tähän tulee suhtautua varauksella sikäli, että Aristoteleen käsitteis- 
tö ei kata relationaalista invarianssia eli suhteita koskevaa säännön- 
mukaisuutta. Substantiaalisen ja relationaalisen sekoittaminen toisiin- 


5o» 


sa johtaa kielen mystifioimiseen: "kielellà on päämääriä”, "kieli reagoi 
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rakenteellisesti”, ”morfeemilla on muutospyrkimys” jne. Substantiaali- 
nen selittäminen perustuu ilmiön ominaisuuksien (essenssin tai poten- 
tian) ja ulkoisen ympäristön suhteeseen. Tämä tarkoittaa, että ilmiössä B 
tapahtuvat muutokset on selitettävä toisaalta niillä tehtävillä, jotka sillä 
on ilmiössä A, mutta erityisesti niillä finaalisyillä tai päämäärillä, joita 
A:lla oletetaan olevan. Substantiaalinen selittäminen kuvaa B:n tehtävää 
suhteessa A:n finaalisyihin. (Ks. kuvio 17.) 


1. Substantiaalinen selittäminen 2. Relationaalinen selittäminen 


LNSIEN S c 


(y1.--Ya) 


A 


Kuvio 17. Substantiaalisen ja relationaalisen invarianssin funktionaalinen selitta- 
minen. 


Relationaalisen invarianssin selittäminen vuorostaan on nimensä 
mukaisesti relaatio: funktio tässä mallissa on sääntö, joka liittää kak- 
si joukkoa yhteen siten, että f: B — C. Funktio liittää siis yksi yhteen 
määrittelyjoukon B:n alkiot (x ...x ) maalijoukon C:n alkioiden kanssa 
(y,--y,). (Ks. kuvio 17.) Relationaalisessa funktiokäsityksessä kummalla- 
kaan joukolla, B:llä tai C:llä, ei ole ”persooniin assosioitua” intentiota, 
vaan puhutaan pelkästään funktion määrittelyjoukon argumenteista ja 
maalijoukon arvoista. 

Relationaalinen funktiokäsitys on implisiittisesti käytössä tilasto- 
tieteessä, mikä tarkoittaa sitä, että niillä kielentutkimuksen alueilla, jois- 
sa tilastotieteillä on rooli, kuten sosiolingvistiikassa, psykolingvistiikassa 
ja typologiassa, tämä käsite on osa metodologiaa. Relationaalisen funk- 
tion käsite on käytössä myös kielitieteen ulkopuolella, esimerkiksi bio- 
logiassa, psykologiassa, erilaisissa itseohjautuvien systeemien teorioissa, 
kybernetiikassa, kaaosteoriassa ja kompleksisten ilmiöiden matematii- 
kassa. Relationaalinen funktiokäsitys on aina oleellinen silloin, kun 
kompleksisuus ymmärretään systeemin luonnollisena ominaisuutena 
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ja kehitysehtona. Kompleksien systeemien määritelmä perustuu näis- 
sä teorioissa siihen, että osat ovat yhteydessä toisiinsa, kokonaisuu- 
teen ja ympäristöönsä hyvin moninaisin eri funktioin. Tämä kytkeyty- 
neisyys johtaa siihen, että osat vaikuttavat sekä toisiinsa että takaisin 
systeemikokonaisuuteen. 

Kun substantiaalinen selitysmalli kuvaa ilmiön essentiaalisia omi- 
naisuuksia muutoksen syinä, relationaalinen selitysmalli vuorostaan 
tarkastelee ilmiön kytköksien vaikutusten seurauksia eri näkökulmista. 
Kyseessä on siis kaksi hyvin erilaista selittämisen mallia. Toinen pe- 
rustuu essenssiin eli olemukseen ja toinen relaatioihin, toimintoihin 
ja rakenteisiin. 


Tieteellisiä selitystyyppejä 


noomiset selitykset (esim. luonnonlaeilla selittäminen) 


teleologiset selitykset (esim. ihmisen käyttäytymisen selittäminen ta- 

voitteiden ja intentioiden valossa) 

— historialliset selitykset (esim. ilmiön synnyn ja kehittymisen kautta 
selittäminen, evolutionaarinen ja geneettinen selittäminen) 

— psykologiset selitykset (esim. selittäminen ihmisen ajattelun ja kogni- 
tiivisten toimintojen valossa) 

— funktionaaliset selitykset (esim. tehtävän mukaan selittäminen) 

— hermeneuttiset selitykset (esim. ilmiön ymmärtämiseen pyrkivä se- 

littäminen) 


Kuten edellä esitimme, nykykäsityksen mukaan havaitseminen on käsit- 
teellistävää ja teoriapitoista (ks. Johdannon luku 2.5. tk.). Teoriapitoisuus 
on eri kysymys kuin kysymys ilmiöiden itsenäisestä olemassaolosta. 


Realistit olettavat, että todellisuus on havaitsijasta riippumatonta eli että 
puu on puu silloinkin, kun sitä ei katsele tai muulla tavoin havaitse 
kukaan tai mikään. Jos kielentutkija kokee itsensä realistiksi, on hänen 
hyvä pohtia, missä määrin kieli on osa ihmisestä riippumatonta todelli- 
suutta eli missä määrin se on itsenäisesti olemassa. Vastakkainen näkö- 
kulma on esimerkiksi, että ilman tiedostavaa ja tulkitsevaa ihmismieltä 
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fysikaalisessa todellisuudessa on pelkästään merkityksettömiä visuaali- 
sia kuvioita (vrt. kirjoitusmerkit) tai ääniaaltoja (vrt. puhe). Esimerkiksi 
konseptualismin mukaan kieli on käsitteellisesti riippuvainen merkeille 
tai ääniaalloille annetusta tulkinnasta eli ihmisestä ja tämän tajunnasta. 

Tieteellisen realismin mukaan tiede kuvaa puuta paremmin kuin 
pelkkä ihmisen aistitieto. Niiniluodon (1993) mukaan tieteellinen kie- 
li ei kehity tyhjiössä, vaan tieteissä kielen ja reaalitodellisuuden välille 
muodostuu toiminnallinen suhde, jossa tutkija muokkaa tieteen kieltä 
jollain tavoin reaalitodellisuutta vastaavaksi. Koska tieteellisiä väitteitä 
testataan ja koetellaan, ne eivät ole samanarvoisia kuin erilaiset arki- 
puheessa esitetyt väitteet ja uskomukset. Esimerkiksi kielitieteessä ver- 
taileva tutkimusasetelma voi joko tukea lausetta ”n:nneksi käytetyim- 
män sanan frekvenssi missä tahansa luonnollisessa kielessä (jonkin 
kielen jossakin laajassa tekstissä) on käänteisesti verrannollinen lukuun 
m tai kieltää sen. Tieteessä väitteiden totuusarvoa tutkitaan, ja siksi jot- 
kin väitteet kelpaavat tieteelliseksi tiedoksi. 

Edellä esitetty väite sanan käyttötiheydestä on George Zipfin (1935) 
havainto, jota kutsutaan usein Zipfin laiksi, mutta täsmällisempi termi 
on kuitenkin Zipfin jakauma (ks. Tieteen termipankki sv. Zipfin laki). 
Zipfin jakaumaa esiintyy niin kielessä, populaatioissa, tulotasoissa kuin 
tv-kanavien katsojaluvuissa jne. Syitä siihen, miksi Zipfin jakaumaa 
esiintyy, on yhtä monta kuin ilmiöitä, joissa jakaumaa esiintyy. Zipf itse 
esitti, että kielessä jakauma muodostuu, koska ihmiset pyrkivät mah- 
dollisimman vähällä ponnistuksella sanomaan mahdollisimman paljon. 
Tulotasoja selitettäessä jakauman selitys on vuorostaan se, että rikkaat 
suosivat toisia rikkaita (ks. Fagan & Ramazan 2010). Zipfin jakauma ei 
siis tosiasiassa ole deterministinen seuraantolaki, sillä se ei ole todel- 
lisuuteen vaikuttava voima tai periaate, jonka avulla voidaan kategori- 
sesti selittää ilmiöitä. Esimerkiksi termodynamiikan kolmas laki, joka 
muun muassa lausuu, että eristetyssä systeemissä kaikki erilämpöiset 
kappaleet aikaa myöten asettuvat samaan lämpötilaan, toteutuu aina. 
Termodynamiikan kolmas laki on luonteeltaan selittävä seuraantolaki 
(luonnonlaki), sillä kun laki tunnetaan, voidaan selittää muutoksia il- 
miössä. Zipfin jakauma vuorostaan kuvaa empiiristä yhteenliittymi- 
sen säännönmukaisuutta, joka on löydettävissä niin biologisista kuin 
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sosiaalisistakin systeemeistä. Jakauma ei kerro, mikä aiheuttaa ilmiöt 
vaan millä todennäköisyydellä jokin asia toteutuu. 

Säännönmukaisuus tarkoittaa sitä, että suuressa otoksessa lähes kaik- 
ki ilmiöt noudattavat jotain jakaumaa. Poikkeuksiakin toki löytyy. Zipfin 
jakaumaa ei esimerkiksi esiinny kiinan kielessä. Koska Zipfin jakauma 
ei ole deterministinen seuraantolaki, se ei itsessään kerro, miksi se ei 
aina toteudu. Silloin kun jakaumaa ei esiinny, joudutaan esittämään 
erillinen selityshypoteesi. Esimerkiksi Dahui, Li Menghui ja Di Zengru 
(2005) esittävät hypoteesin siitä, että uusien kiinan sanamerkkien luo- 
minen ja merkistön satunnainen muuttuminen ovat hitaampia kuin 
kielissä, joissa on äänteisiin perustuva aakkoskirjoitus. 

Realismiin sisältyy usein käsitys, jonka mukaan maailma on lain- 
omainen (noominen) ja on olemassa empiirisiä deterministisiä 
luonnonlakeja. Tieteen tehtävä on löytää reaalitodellisuuden seu- 
raanto- ja yhteenliittymälait. Tällaisen maailmankuvan houkuttele- 
mat kielentutkijat nimittävät herkästi myös kielitieteessä havaittuja 
säännönmukaisuuksia laeiksi silloinkin, kun on varsinaisesti kysymys 
tilastollisesta jakaumasta tai muusta säännönmukaisuudesta. Tutkijan 
tulee siis olla tarkka siitä, millaisia käsitteitä hän käyttää (esim. ovatko 
ne keskenään koherentteja), ja tarkastella, miten käsitteistö ohjaa hänen 
tutkimuksensa suuntaa ja päätelmiä. 

Kausaalisuus sekaantuu tai yhtäläistyy helposti käsitteen seuraanto- 
laki kanssa. Kaikki kausaalisuus eli aiheutus ei johdu deterministisistä 
luonnonlainomaisista tekijöistä (vrt. esim. normaalissa ilmanpaineessa 
divetyoksidi eli vesi höyrystyy 100 celsiusasteessa). Esimerkiksi pe- 
lästynyt rotta voi kiihottaa muut rotat ympäristössään juoksemaan eri 
suuntiin. Mentaalinen tila siis aiheuttaa ulkoisesti havaittavaa käytös- 
tä. Vaikka samankaltaisen mentaalisen ilmiön vaikutuksen joukko- 
käyttäytymiseen ja sen säännönmukaisuuden voi havaita myös muissa 
eläinlajeissa, kyseessä ei ole seuraantolaki. Sosiaalisesti jaetut ilmiöt 
aiheuttavat säännönmukaisuuksia populaation tasolla, koska niillä on 
yksilöiden toimintaa suuntaava ja ohjaava samankaltainen vaikutus 
— näin on myös kielessä. Jotkin yleistettävät lauseet voivat olla selitys- 
voimaisia ja myös ennustaa tapahtumia olematta kuitenkaan seuraanto- 
lakeja. Esimerkiksi lauseet ”pelästynyt rotta juoksee” ja ”kieli on ihmisen 
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ominaisuus” voidaan parhaiten ymmärtää teoreettisina kvalitatiivisina 
yhteenliittymislakeina. 

Kielentutkimuksessa ehkä lainomaisimmin ymmärretty käsite 
on ollut äännelaki. Se on historiallis-vertailevassa, erityisesti nuor- 
grammaattisessa kielentutkimuksessa käytetty käsite, jolla tarkoitetaan 
tietyllä ajanjaksolla, tietyssä kieliyhteisössä ja tietyssä äänneympäristössä 
tapahtunutta säännöllistä äänteenmuutosta (vrt. synkroninen äänteen- 
vaihtelu). Tällainen on ollut esimerkiksi t:n assibilaatio s:ksi i:n edellä 
(käsiä < käte+i, missä monikon i ottaa vartalovokaalin e paikan ja assi- 
biloi sitten vartalon toisen tavun konsonantin t). Tämä ti > si -muutos 
on pystytty ajoittamaan suhteellisen kronologian avulla kantasuomen 
sellaiseen jaksoon, jolloin kieleen tuli runsaasti (vanhimpia tunnettuja) 
balttilaisia lainasanoja. Nämä osallistuivat ti > si -muutokseen (esim. 
silta < liett. tiltas ’silta’) kielen omaperäisen sanaston ohella. Sen sijaan 
myöhemmät lainat, esimerkiksi germaaniset (esim. äiti) tai slaavilaiset 
(esim. katiska) lainat eivät osallistuneet muutokseen, sillä äännelaki ei 
ollut tuolloin enää vallitseva. (Äännelaista ks. Historiallinen ja vertaileva 


kielentutkimus tk.) Kyseessä ei kuitenkaan ole empiiristä seuraantolakia 
vastaava välttämätön voima, joka deterministisesti ohjaisi kieltä. Äänne- 
laki muodostuu joukosta ehtoja, joiden täyttyessä äännejärjestelmässä 
voi tapahtua muutoksia. Lainomaisen siitä tekee vahva vaikuttavuus sen 
voimassaoloaikana ehtojen täyttyessä mutta vastaavasti vähemmän lain- 
omaisen sen ajallinen tilapäisyys. Sen taustalla voi nähdä myös yleisiä 
periaatteita, kuten ”kaikissa kielissä esiintyy muutoksia” tai ”äänteiden 
muutos ei kunnioita kieliopillisia jakoja”. Nämä periaatteet eroavat de- 
terministisistä luonnonlaeista, esimerkiksi painovoimasta, joka lausuu, 
että kaikki massalliset kappaleet vetävät toisiaan puoleensa. Painovoima 
on universaalisti tosi ja selittävä. 

Pelkkä laki-sanan käyttö ei siis merkitse, että kielessä vaikuttaisi 
luonnonlain kaltaisia voimia. Kielen muutoksia rajoittavat periaatteet 
ovat useimmiten luonteeltaan osittain loogisia ja biologisia (esim. ”mi- 
kään äänne, jota ihmisen kuulojärjestelmä ei pysty erittelemään, ei voi 
olla merkitystä erottava tai välittävä”), tai periaatteiden motivaatio on 
ihmisen ja ihmisryhmien tavoitteisiin liittyvä eli teleologinen. Kielen- 
tutkimuksessa on siten mielekästä pohtia, millä lailla kausaalisuus, 
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säännönmukaisuus tai loogiset rajoitteet on käsitteellistetty metodin 
taustateoriassa. Kausaalisuuden ja lainomaisuuden käsitteellinen sekoit- 
taminen toisiinsa voi aiheuttaa erheellisiä mielikuvia kielen luonteesta 
ja ohjata siten myös tutkimusta väärään suuntaan. Kuten tässä luvussa 
aiemmin esitetystä taulukosta 1 huomataan, lainomaisia ilmiöitä on eri- 
laisia, ja seuraantolait ovat oma erityinen luokkansa. 

Chomskyn olettamat biologista alkuperää olevat kielen universaa- 
lit, joiden mukaan puhutuilla luonnollisilla kielillä on yhteinen perus- 
rakenne, nostetaan toisinaan myös keskusteluun käsitteen laki yhtey- 
dessä. Tämä voi kuitenkin johtaa harhaan. Esimerkiksi käsitys siitä, että 
västäräkin viserrys eroaa tuulihaukan äänestä, koska näiden kahden 
linnun DNA on erilainen, ei oikeuta päätelmään, että västäräkin viser- 
rys on lainomainen. Västäräkin viserrys, tuulihaukan ääni ja ihmisen 
luonnollinen kieli ovat lajityypillisiä piirteitä. Geenit sisältävät kontin- 
genttia (ks. Johdannon luku 2.3. tk.) informaatiota, joka sekä mahdollis- 


taa että rajoittaa suurelta osin kaikkien elävien organismien fenotyypin 
funktioita. Lajikohtaisissa funktioissa on siksi odotettavissa lajin sisäistä 
säännönmukaisuutta, ja odotettavaa on myös, että osa funktioista muut- 
tuu evoluution myötä. Chomskylaisittain ajatellut kielen universaalit 
eivät siten ole luonnonlakiin verrattavissa oleva ilmiö, vaan ne ovat ym- 
märrettävissä lajityypillisenä säännönmukaisena funktiona niiltä osin 
kuin kielellä on geneettistä perustaa. Loogisesti on myös oleellista huo- 
mata, että siitä väitteestä, että jokin kielen piirre on biologian rajoittama 
tai motivoima, ei seuraa, että kaikki kielen keskeiset elementit olisivat 
geneettistä alkuperää. Biologinen rajoite kielelle ei myöskään tarkoi- 
ta, että rajoitteiden täytyy olla kielispesifejä: ihmisen muisti, kognitii- 
viset prosessit ja havaintomekanismit kaikki asettavat rajoitteita sille, 
mikä kielessä ja kommunikaatiossa on mahdollista. Kieliopillisten tai 
semanttisten rakenteiden redusoiminen yksinomaan geneettiseen in- 
formaatioon ei siten ole motivoitua, vaikka käsitteeseen universaali täl- 
lainen elementti voidaan liittää. 

Toisessa merkityksessä universaaleista on puhuttu kielitypologiassa. 
Typologisilla universaaleilla tarkoitetaan maailman kieliä ja ihmiskieltä 
yleensä koskevia havaintoja, jotka perustuvat suurten kielimäärien poh- 
jalta tehtyihin induktiivisiin yleistyksiin. Typologiset universaalit ovat 
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tyypillisesti vahvoja tilastollisia tendenssejä, ja täysin poikkeuksettomat, 
absoluuttiset universaalit ovat harvinaisia. Termi universaali on näin eri- 
laisessa käytössä typologiassa kuin yleensä tieteenfilosofiassa, jossa tilas- 
tollinen ja universaali ovat toistensa vastakohtia. Lakien sijaan tällaiset 
universaalit edustavat pikemmin siis erivahvuisia tendenssejä kielten 
osajoukosta. Vaikutelma lainomaisuudesta vahvistuu sitä mukaa, mitä 
vahvemmasta tendenssistä on kyse. Typologiassa tehdään myös jako 
implikationaalisiin ja ei-implikationaalisiin universaaleihin. Implikatio- 
naaliset universaalit sisältävät ehdon (esim. kaikissa kielissä pätee, että 
jos kielen perussanajärjestys on SOV, sen adpositiot ovat ensisijaisesti 
postpositioita eivätkä prepositioita). Ei-implikationaaliset ovat yksin- 
kertaisia väittämiä (esim. kaikissa kielissä on vokaaleja ja konsonantte- 
ja). Sekä implikationaaliset että ei-implikationaaliset universaalit voivat 
olla poikkeuksettomia absoluuttisia universaaleja tai vahvoja tilastollisia 
tendenssejä. Typologisia universaaleja on esitetty kymmeniä. (ks. Kieli- 
typologian menetelmät tk.). 


Laeista puhuttaessa voi vielä mainita Gricen maksiimit eli vuoro- 
vaikutuksen yhteistyöperiaatteet (Grice 1975). Näitä ovat laadun (”puhu 
totta”), määrän ("ole riittävän informatiivinen”), relevanssin (”pysy asias- 
sa”) ja tavan (”ole ymmärrettävä”) maksiimit. Vaikka Grice tarkoitti mak- 
siiminsa deskriptiivisiksi luonnehdinnoiksi vuorovaikutuksen yleisistä 
periaatteista tai ideaalista, niitä on usein tulkittu lainomaisina preskrip- 
tiivisen normituksen merkityksessä. Kyse on kuitenkin hyvin yleisen 
tason sosiaalipsykologisista periaatteista, jotka ovat paljolti kulttuurisesti 
määräytyneitä tavanomaisuuksia. Eri kulttuuripiireissä maksiimit voivat 
korostua eri tavoin. Tässä laki-termi on käytössä velvoittavan kulttuuri- 
sen säädöksen merkityksessä, mutta maksiimeja voisi luonnehtia mää- 
rällisiksi tai laadullisiksi tilastollisiksi yhteenliittymislaeiksi: relevans- 
sista poikkeavat keskustelupuheenvuorot ovat normaalisti jakautuneita. 
Järkevintä tutkimuksessa on kuitenkin olla käyttämättä laki-käsitettä sil- 
loin, kun ei ole kyse deterministisestä laista. Läpinäkyvä käsitteellinen 
selitys yhteenliittymisen tai tilastollisuuden laadusta on tieteen etiikan 
mukainen rehellinen esitys. 

Erilaisia selittämismalleja on lukuisia. Edellä esitelty Zipfin ja- 
kauma ilmentää tilastollista selittämistä, ja kielitypologian esittämiin 
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universaaleihin pyritään löytämään funktionaalisia selityksiä. Äännelait 
kuvaavat historiallista tai evolutionaarista selittämistä. Gricen maksiime- 
ja voi pitää vuorovaikutuksen järjestymisen funktionaalisena selittämise- 
nä. Samoin analogiaa äännelakien vastinparina voi pitää kielisysteemin 
jäsentymisen funktionaalisena selittämisenä. Muita selitysmalleja ovat 
muun muassa kausaalinen, intentionaalis-teleologinen (tavoitteisiin ja 
päämääriin perustuva) ja geneettinen (alkuperään tai syntyyn perustuva) 
selittäminen. 

Selittämisestä voidaan pyrkiä vielä edemmäs asioiden ja ilmiöiden 
ennakoimiseen ja ennustamiseen, jolloin ihminen voi toimintaansa jär- 
jestelemällä tavoitella haluamiaan tuloksia. Esimerkiksi kun lapsen vii- 
västynyt puheenkehitys tunnistetaan (ilmiön kuvaus) ja tilan aiheuttanut 
tekijä ymmärretään (esim. geneettinen selitys, fysiologinen tekijä), on 
mahdollista harjoittaa kieltä niin, että viivästyksen aiheuttama heikennys 
lapsen elämänlaadulle vähenee tai poistuu kokonaan. Tällaisella sovelta- 
valla kielentutkimuksella voidaan vaikuttaa takaisin maailmaan, mutta 
se edellyttää pätevää kuvauksen ja selittämisen perinnettä. 

Selittäminen tieteessä yleensä tai kielentutkimuksessa erityisesti 
(esim. Wunderlich 1979 [1974], luku 3) kattaa ison ja haastavan tieteen- 
filosofian osa-alueen, jota on tutkittu valitettavan vähän. Suomalaisessa 
kielentutkimuksessa funktionaalista selittämistä kielen muutoksen ku- 
vaamisessa on käsitellyt Määttä (1994). Konkreettinen ja havainnollinen 
esitys selittämisestä on Wiikin (1984) tutkimus, jossa hän esittää lukui- 
sia tapoja selittää suomen taivutusjärjestelmän sellaista erikoisuutta, 
että voidaan ja pitääkin sanoa kana : kanoja mutta ei muna : *munoja 
(vaan munia). 

Edellä on huomattu läheinen suhde todellisuuskäsityksen ja kielen- 
tutkimuksen tutkimuskäsitteistön välillä. Samalla on hyvä panna mer- 
kille myös erilaisten tiedekäsitysten ja -ihanteiden vaikutus tieteessä 
yleensä ja tieteenalojen kesken. Lisätutkimus kielentutkimuksen käsit- 
teistöstä ja erityisesti loogisia ristiriitoja aiheuttavista termeistä tutki- 
muksessa olisi tervetullutta. 
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3.2.3. KIELEN REIFIKAATIO, NORMI JA ONTOLOGIA 

Reifikaatioksi kutsutaan abstraktin ilmiön muuttamista konkreettiseksi. 
Metodologiassa sillä tarkoitetaan, että konstruoidulle tutkimuskohteelle 
osoitetaan ontologinen asemapaikka. Tutkija esimerkiksi päättää kutsua 
aineistosta noussutta ilmiötä nimellä X (esim. kongruenssi). X on ter- 
millä nimetty teoreettinen konstruktio, jonka määritelmä muodostuu 
toisista käsitteistä ja viittauksista aineiston ominaisuuksiin. Konstruktio- 
validiteetti on myös metodologiassa käytetty käsite, joka tarkoittaa sitä, 
missä määrin tutkimuksen muuttujat mittaavat täsmällisesti teoreettista 
konstruktiota (Vogt 1999, 53). Reifikaatio on siis tavallaan käsitteellinen 
oikopolku, jossa ei lopulta ole huomioitu kaikkia niitä tutkimuksen vai- 
heita, jotka johtivat teoreettisen konstruktion luomiseen (datan käsit- 
tely, transkribointi, analyysi ja luokittelu jne.). Sen sijaan nimeämällä 
luodaan diskreetti olemassaolo teoreettiselle yläkäsitteelle. Reifikaation 
asteita on useita, ja ontologisoiminen on niistä vahvin. 

Jo arkinen kieli tarjoaa yhdenlaisen käsityksen kielestä reifioituna: 
”Mitähän kieltä tuo puhuu? Millainen kieli on chickasaw? Kuinkahan 
helposti sen kielen oppii?” Arkinen kielenkäyttömme ohjaa ajattele- 
maan kieltä rajautuvana asiana. Substantiivi kieli nimeää olion, joka on 
abstrakti mutta kuitenkin ikään kuin rajoiltaan hahmottuva. Näin se 
näyttäytyy enemmän esinemäiseksi käsitteellistettynä kuin toimintana, 
jota esimerkiksi kielen tavalliset ilmentymät, kuten puhuminen, kuun- 
teleminen, väittäminen ja lupaaminen, ykskantaan ovat (ks. Johdannon 
luku 3.1. tk.). Kieli voi siis hahmottua oliona — toki erilaisena oliona kuin 
konkreettinen kivenmurikka tai naapurin Matti. 

De Saussuren (2002 [1916]) merkkikäsitys on myös yksi esimerkki 
reifikaatiosta. Kielellinen merkki on konkreettinen objekti: ”The signs 
comprising a language are not abstractions, but real objects. Linguistics 
studies these objects and relations between them. They may be termed 
the concrete entities of that science.” (Mts. 144.) Vaikka de Saussure 
(mt.) onkin kielen teorian klassikko, niin on olemassa useita tulkintoja 
siitä, mitä hän tarkalleen tarkoitti3 

Metafysiikan perusteorioihin tutustuminen on kielentutkijallekin 
tarpeellista. Vaikka erityisesti puhutun kielimuodon raakadatasta voi 
olla vaikea löytää itsenäisiä, autonomisia ja diskreettejä yksiköitä, usein 
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kysymykseen, mitä kieli on, vastataan aivan kuin tällaisia itsenäisiä yk- 
siköitä olisi olemassa. Tämä ilmentää tapaa tavoitella yleistyksiä kielestä. 
Esimerkiksi käsitys kielestä sosiaalisena normistona on yksi ominainen 
tapa käsitteellistää kielen olemusta. Termit normi ja normisto viittaavat 
käsitykseen, että kieltä voidaan koettaa käsitteellistää normien diskreetti- 
nä osajoukkona L {n....n,}. Sosiaalinen normisto ei kuitenkaan ole ainoa 
tapa kuvata kielen olemusta. Generatiivinen kielentutkimus olettaa, että 
kieli on yhtä kuin kielikyky: yksittäisten kielten säännöt ovat seurauksia 
sisäsyntyisestä universaalista kieliopista (esim. Chomsky 2007, 50-52; 
Brattico 2008, 9). Kielen normeja ei sisäistetä niinkään oppimisen myö- 
tä, vaan kielen ulkoisia säännöstöjä kehittyy sisäisen kielikyvyn seurauk- 
sena. Tämän käsityksen mukaan kieli on sellainen sisäsyntyisten sään- 
töjen osajoukko, joka generoi kaikki kieliopilliset lauseet L (s....s ). Kieli 
normistona tai universaalina kielioppina ovat ilmentymiä pyrkimyksestä 
kielijärjestelmän reifioimiseen. 

Viimeistään de Saussuren kielikäsitys johti kysymykseen kielen ja 
sen yksiköiden identiteetistä ja ontologiasta (de Saussure 2002 [1916], 
154). Sama kysymys askarrutti myös Wittgensteinia (1997 [1953], 558), 
ja sekä de Saussure että Wittgenstein antoivat lopulta samankaltaisen 
vastauksen: yksikön merkitys rakentuu muita kielellisiä yksiköitä vas- 
ten. Vain osana kielijärjestelmää voi yksiköllä (äänteellä, morfeemilla, 
sanalla ym.) olla merkitys (Harris 1988, 19). Kielet ovat järjestelmiä eli 
joidenkin periaatteiden toiminnallisia kokonaisuuksia (Wittgenstein 
1997 [1953]. 170). 

Käsitykset siitä, miten kielijärjestelmät ovat olemassa, perustuvat 
kuitenkin erilaisille premisseille: De Saussure perustaa merkit niiden 
keskinäisten assosiaatioiden varaan, Wittgenstein sääntöjen seuraa- 
miseen. Wittgensteinin mukaan sääntö on olemassa ainoastaan sen 
seuraamisen kautta, eikä sillä siten ole itsenäistä olemassaoloa yksilön 
mielessä. Kielisääntöjen seuraaminen on konkreettinen aktiviteetti (ks. 
Baker & Hacker 1988, 154-156). Wittgenstein kieltää mentaalisuuden 
kielijärjestelmän perustana: kieli ei saa merkitystä merkkien välisten 
assosiaatioiden kautta. 

De Saussure ja Wittgenstein tarjoavat siis kaksi keskenään erilais- 
ta käsitystä kielestä järjestelmänä. Kumpikaan ei ole normisto. Termi 
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normi tulee latinan sanasta norma, joka alun perin tarkoitti puusepän 
työkalua, jolla tehtiin tasaisia muotoja ja kulmia. Muotilla siis standar- 
disoitiin puutyöt. Normi-termin käyttö kielitieteellisissä tutkimuksissa 
yleistyi vasta 1950- ja 1960-luvuilla etno- ja sosiolingvistiikassa. Sosio- 
lingvistiikassa Labov ei käyttänyt normi-termiä kuitenkaan vielä 1970-lu- 
vulla vaan käsitteellisti yleensä ihmisen kielellistä toimintaa ohjaavan 
laskennallisen ilmiön muuttujasääntönä (engl. variable rule). On huo- 
mattava, että termiä normi käytettiin ja käytetään monesti edelleen näillä 
aloilla ulkoisen käyttäytymisen selittäjänä eli esimerkiksi merkityksessä 
'normi on odotettavissa oleva ryhmän toiminnan malli tai 'normi on 
vuorovaikutuksen muoto, jonka välityksellä yhteisö saa jäsenensä toimi- 
maar (ks. myös Crystal 2008 sy. norm). Normi on siis näin määritellen 
aineistoperustaisen tutkimuksen havaintoja systematisoiva konstruktio, 
jota käytetään ihmisten ulkoisen kielikäytöksen kuvaamiseen (ks. kuiten- 
kin Sherif 1965). Normi-termin merkityksestä on kielitieteessä keskustel- 
tu laajasti 1970-luvulta alkaen (ks. esim. Kauhanen 2006; Itkonen 2019). 

Käsitys sosiaalisista kielellisistä normeista sisäistettynä järjestelmä- 
nä ei vaikuta olevan osa kielen mentaalisia prosesseja tutkivien alo- 
jen käsitejärjestelmiä. Kielipsykologian, psykolingvistiikan tai neuro- 
psykologian tutkimuksista, perusteoksista ja ensyklopedioista ei yleensä 
löydy termiä normi. Nämä tutkimusalat tarkastelevat ihmisen aivojen ja 
mielen sisäisiä kielen ymmärtämisen ja tuottamisen prosesseja. Edes 
kognitiivisen kielitieteen perusteoksien hakemistoista ei tunnu löytyvän 
termiä normi sellaisenaan (ks. Langacker 1987; Lakoff 1987; Tomasello 
2005; vrt. Mäkilähde & Hynönen 2019). 

Kielen sosiaalista ontologiaa, sosiaalista normistoa, ihmismielestä 
erillisenä ja itsenäisesti olemassa olevana järjestelmänä ovat ehdottaneet 
Searle (2008) ja Itkonen (1997). Searlen (mt.) näkemyksen mukaan kieli 
on instituutio, joka mahdollistaa muiden sosiaalisten instituutioiden, 
kuten talous- ja sopimusjärjestelmän, valtion ja muiden sosiaalisten so- 
pimusten ja yhteisliittymien, olemassaolon. Itkonen (1997; 2019) vuo- 
rostaan perustaa kielen sosiaalisen ontologian normatiivisuuteen. Kielen 
sosiaalista puolta korostavilla filosofioilla on myös taipumus reifikoida 
ja ontologisoida teoreettisia käsitteitä. Esimerkiksi sellaiset luonneh- 
dinnat kuin ”language is a social entity” tai ”language is an object of 
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common knowledge” ilmaisevat käsityksen kielestä objektina ja oliona. 
Reifikaation vaikutus kielen metateoriaan on silloin ilmeinen, kun ole- 
tetaan, että jokin on objekti, olio tai entiteetti. Tällöin on myös vastattava 
metafyysisiin kysymyksiin, missä ja miten tuo olio on olemassa. 
Tutkijoiden edustamia erilaisia kielikäsityksiä voi sijoittaa Popperin 
(1978) kolmen maailman malliin (ks. Johdannon luku 3.2.1. tk.). Taulu- 
kossa 2 joitakin edellä mainittuja kielen teorioita on sovitettu Popperin 


kolmen maailman rakenteeseen. 


MAAILMA NORMI MUU 

Maailma 1 (M1): Labov (?) Wittgenstein (sääntö) 
fysikaalinen taso 

Maailma 2 (M2): Langacker (skeema), 
mentaalinen taso Chomsky (universaalikielioppi) 
Maailma 3 (M3): Searle 


sosiaalinen taso 


Taulukko 2. Popperin maailmat ja erilaisia kielikäsityksiä. 


Taulukossa 2 Labovin ajattelu on varauksella sijoitettu normikategoriaan, 
sillä kuten Kauhanen (2006) on havainnollistanut, Labov aloitti kieli- 
tieteessä uudenlaisen keskustelun juuri normien luonteesta, vaikkei aina 
tuota käsitettä käyttänytkään. Labov kohdisti normin tarkastelun paikalli- 
sen kieliyhteisön käyttäytymiseen, jota voi havaita empiirisesti. Keskiössä 
oli kieliyhteisön muodostuminen. Tämä oli ristiriidassa tuolloin domi- 
noivan generativistisen kielinäkemyksen kanssa, jossa normisysteemi oli 
abstrakti järjestelmä, johon oli pääsy intuition (kielitajun) kautta. 
Wittgensteinin filosofia sijoittuu maailmaan 1. Hänen esittämänsä 
yksityiskieliargumentti on suunnattu kielen psykologismia vastaan: sa- 
nat eivät saa merkitystään puhujan sisäisistä assosiaatioista, muiden 
tavoittamattomissa olevista yksityisistä mielentiloista. Yksityinen kieli 
on vain yhden ihmisen ymmärtämä, sillä se perustuu ainutlaatuisiin ja- 
kamattomiin mielensisältöihin. Niin de Saussure kuin Wittgensteinkin 
korostivat kielen sosiaalista puolta, mutta on hyvä tiedostaa, että ei ole 
olemassa suoraa yhteyttä konkreettisen M1:n ja sosiaalisen M3:n välillä 
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ilman ihmisen mieltä (M2). Wittgensteinin käsitys säännön seuraami- 
sesta on ulkoista seuraamista, samoin kuin Labovilla. 

Popperin kolmen maailman malli perustuu materialismiin, eli se 
olettaa, että kysymys materian (M1) ontologiasta on ongelmaton ja ai- 
noastaan tietoisuus (M2) ja sosiaalinen taso (M3) tarvitsevat perusteluja. 
Tämä johtaa siihen, että jos olettaa jonkin materiasta erillisen mentaali- 
sen tai sosiaalisen todellisuuden, jossa normit tai säännöt sijaitsevat, on 
vastattava kysymykseen, mikä on se laki tai periaate, joka selittää sen, 
miten nämä erilaiset substanssit ovat keskenään tekemisissä. Jos normi 
tai mieli voi vaikuttaa materiaan, niin silloin se on samassa todellisuu- 
dessa materian kanssa ja asetelma on monistinen. 

Emergenttinen materialismi olettaa, että materiasta emergoituu mie- 
li ja monien mielten yhteistoiminnoista kieli. 1990-luvulla kannatusta 
saanut supervenienssi-käsite (engl. supervenience, suom. myös päältä- 
vyys) sanoo, että kaksi ilmiötä, esimerkiksi neurologinen aivotoiminta 
ja tietoisuus, toimivat samaan aikaan. Ilman aktiivisuutta yhdessä ei ole 
aktiivisuutta toisessa. Tämä on kuitenkin analogisesti sama asia kuin sa- 
noa, että Matissa ja Itämeressä tapahtuu muutos samanaikaisesti. Väite 
samanaikaisuudesta ei selitä kahden ilmiön yhteyttä, eikä se ole vastaus 
kysymykseen, miten fysikaalinen ja mentaalinen vaikuttavat toisiinsa. 

Myös materialismia itseään kohtaan voi suunnata kritiikkiä esi- 
merkiksi Searlen (1980) kiinalaisen huoneen tapaisilla analogioilla: Sul- 
jetussa huoneessa on mies, joka ei osaa kiinaa, mutta hänellä on sääntö- 
kirja, joka kertoo, mikä piktogrammi tulee liittää toiseen. Luukusta tulee 
merkki, johon mies vastaa toisella merkillä. Hän toimii siis tilantees- 
sa sääntökirjan ohjeen mukaan ja siten täysin korrektisti, ja huoneen 
ulkopuolella olevat uskovat miehen osaavan kiinaa. Analogiaa voidaan 
laajentaa uusiin teknologioihin: Jos kieli ja tietoisuus eivät ole mitään 
muuta kuin materiaalisia prosesseja, ymmärtääkö kielenkorjausohjelma 
kieltä? Entä puhuuko kieltä ihminen, joka toistaa mekaanisesti vieraan 
kielen sanoja Google-kääntäjästä? Ovatko tällaiset mekaaniset toiminnot 
samoja intuitioita tai toimintoja kuin ihmisen kielen normia koskevat 
kieli-intuitiot (kielitaju) ja puhe? 

1990-luvun lopulta lähtien erilaiset systeemiset filosofiat ovat esittä- 
neet sen näkemyksen, että materiaalin, mielen ja sosiaalisen ongelma 
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olisi väärän kysymyksenasettelun tulos. Esimerkiksi rakennerealismi 
esittää, että kaikki (niin materia, mieli kuin sosiaalinen) koostuu re- 
laatioista, rakenteista ja systeemeistä. Olioilla ei ole sinänsä itsenäistä 
olemassaoloa. Kieli tämän näkemyksen mukaan on useiden systee- 
mien summa eli itsenäisten sääntöjen ohjaamien toimivien osien muo- 
dostama kompleksinen järjestelmä, jonka toimintasäännöt (normit, 
säännöt) muodostuvat osajärjestelmien välisestä vuorovaikutuksesta. 
Edellä luvussa 3.2.1. esitetyn kuvion 17 laatikot symboloivat systeemejä. 
Systeemien interaktiivisista relaatioista syntyy uusia dynaamisia relaa- 
tioita, jotka vaikuttavat takaisin systeemeihin. Esimerkiksi muutokset 
kielenkäytön eri tyyleissä ja rekistereissä vaikuttavat muihin systee- 
meihin. Systeemiset relaatiot muuttuvat ajassa, ja uusia ilmiöitä syntyy 
koko ajan. Kieltä ei siis voi rakennerealismin sisäisesti redusoida vain 
kolmeen ontologiaan. Kieli on systeemisten relaatioiden dynaaminen, 
muuttuva ja alati kehittyvä joukko, jota ei ehkä voi laisinkaan tyhjentä- 
västi määritellä. 

Rakennerealismin keskeinen ajatus on, että eksistenssi on relaa- 
tiossa olemista. Tämä tarkoittaa, että erilaisia olemisen tapoja on 
periaatteessa yhtä paljon kuin voidaan kuvitella erilaisia relaatioita. 
Rakennerealismia kutsutaan siksi myös sademetsärealismiksi kieli- 
kuvana sademetsän monimuotoisuudesta ja runsaslajisuudesta. Kieli- 
tieteen metateorian kannalta ajatus on mielenkiintoinen. Se tarkoittaa, 
että rakennerealismissa ei tarvitse sitoutua esimerkiksi vain yhteen nor- 
min tai säännön määritelmään. Oletus on, että normeja on erilaisia ja 
että kielen sääntöjä muodostuu eri tavoin. Tämä myös tarkoittaa sitä, 
että kielitieteen eri tutkimusnäkökulmien tutkimusten tulokset voivat 
periaatteessa kaikki olla valideja. Ne voivat kertoa tosia asioita komplek- 
sisen systeemin toiminnoista. 

Edellä on huomattu, että sellainen keskeinen ja perustava kielen- 
tutkimuksen käsite kuin normi johtaa monimutkaisiin ontologisiin 
kysymyksiin ja metafyysisiin sitoumuksiin. Tutkijan tulee siis pohtia 
reifikaatiota ja sitä, millaisen olemassaolon hän osoittaa jollekin kielen- 
tutkimuksen teoreettisesti konstruoidulle käsitteelle ja millä perustein. 
Tämä määritelmä nimittäin sitoo tutkimuksen johonkin ontologiaan. 
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3.3. Kielentutkimuksen olemuksesta 


3.3.1. KUVAUKSEN SUHDE KOHTEESEEN: ESIMERKKEINA 
FORMALISMI JA FUNKTIONALISMI 

Tässä luvussa tarkastellaan sitä, millä tavoin suhde tutkimuksen koh- 

teeseen eli kieleen rakentaa tutkimusohjelmaa. Erilaisten tutkimus- 

ohjelmien jaottelut (esim. Scholz, Pelletier & Pullum 2016; ks. Joh- 

dannon luku 3.2. tk.), uskomukset kielen luonteesta ja arvopainotteiset 

premissit tutkimuksen tavoitteista ohjaavat kielentutkimusta. Tässä ava- 


taan näkökulmia kielitieteelliseen tutkimukseen alalla melko vakiintu- 
neen formalismi-funktionalismi-jaon avulla. Tavoitteena on tarkastella, 
miten kielentutkimuksen kohde, luonnollinen kieli (puhuttu, viitottu tai 
kirjoitettu), on aina rajauksen ja näkökulman vanki. 

Luonnollinen kieli voidaan rajata nimeämällä kielen jokin muoto esi- 
merkiksi epämuodolliseksi arkipuheeksi, juhlapuheeksi, vihapuheeksi 
tai huolitelluksi yleispuhekieleksi. Eri luonnehdinnat synnyttävät käsi- 
tyksiä, millaisesta kielestä ja kielellisestä toiminnasta on kulloinkin ky- 
symys. Kielentutkimuksessa myös nojataan usein oletukseen siitä, että 
kuvattu ilmiö kuuluu kieleen tai johonkin sen muotoon, varieteettiin 
(lektiin).^ Esimerkiksi korpuksiin perustuvan tutkimuksen yksi lähtö- 
kohta on, että käytettävä korpus edustaa jotain kieltä tai sen osaa (esim. 
suomenkielistä sanomalehtitekstiä 2010-luvulla). Kielentutkimuksessa 
on siten kyseessä aina jokin näkökulmainen rajaus kieleen: tavoitteena 
on tehdä yleistyksiä kielestä (esim. johonkin tilastolliseen otantaan pe- 
rustuvan) aineiston perusteella. Sitä, millainen olemus tällä yleistyksen 
kohteella eli kielellä on, käsitellään seuraavaksi. 

Kuvio 18 ilmentää karkeasti kahden keskeisen kielitieteen koulu- 
kunnan tai katsantokannan, formalismin ja funktionalismin, suhtau- 
tumista kielen muotoon ja merkitykseen. Formalistinen suuntaus (ks. 
esim. Chomsky 2001 [1965]) keskittyy kuvaamaan kielen rakenteita ja 
niiden muodostamaa kielen järjestelmää. Näkemys esittää toisinaan, 
että kielen muoto on täysin autonominen (1) (ks. kuvio 18). Sen mukaan 
muotoon ei siis liity merkitystä, eikä merkityksen kuvauksen välttämättä 
katsota kuuluvan lainkaan kielentutkimuksen alaan (esim. Bloomfield 
1957 [1933], luku 9). Astetta lievemmässä kannassa oletetaan, että kielen 
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muoto on pääasiallisesti autonomista mutta käyttö vaikuttaa paikoin 
muotoon (2). Tämän voi tulkita joko niin, että käyttö vaikuttaa muodon 
ilmiasuun (esim. runsas käyttö kuluttaa muotoa), tai niin, että käyttö 
koodaa jonkin verran merkitystä. 

Funktionalistinen suuntaus taas keskittyy usein kuvaamaan kielen 
käyttöä havaittavien esiintymien kannalta (ks. esim. Haddington & Si- 
vonen 2010). Se kuvaa kieltä erityisesti merkityksen muodostumisen 
ja välittymisen valossa silloin, kun kieli on osa sosiaalista toimintaa. 
Kuviossa 18 funktionaalisista näkemyksistä lievemmän mukaan kielen 
muodon ajatellaan perustuvan pääsääntöisesti käyttöön, mutta poik- 
keuksiakin on (3). Tällöin merkitystä ajatellaan ennen kaikkea prag- 
matiikkana (merkitys on käyttöä’), mutta osa merkityksestä nähdään 
vakiintuneena. Samalla kielen muoto voidaan nähdä vahvasti käytön 
motivoimana. Hyvin funktionalistinen näkemys olettaa, että kielen 
muoto perustuu vain käyttöön (4). Muotoa ei tavallaan ole ilman sen 
konkreettista ilmentymää käytössä, ja merkitys on hyvin pragmatistista; 
se kehkeytyy vain kielenkäyttötilanteissa ajallis-paikallisesti ja joskus pal- 
jolti ilman kielellistä muotoa muin viestinnällisin keinoin (esim. elein 


ja ilmein). 
rakenne järjestelmä A 1. Kielen muoto on autonominen. 

"muoto" i 2. Kielen muoto on pääasiassa autonominen, 
NAT ae d mutta joiltain osin käyttö vaikuttaa muotoon. 
” merkitys” 3. Poikkeuksia lukuun ottamatta kielen muoto 

perustuu olennaisesti käyttöön. 
esiintymä käyttö 


4. Kielen muoto on täysin käytöstä riippuvaa. 


Kuvio 18. Formalistisen ja funktionalistisen suuntautumisen taustaoletusten ero- 
ja (soveltaen Nikannetta 2015; 2018, 9-10). 


Kuvion 18 karkeistus havainnollistaa käytännössä sitä, mikä näkökulma 
tutkimuksella on kielen muotoon ja merkitykseen ja pidetäänkö jompaa- 
kumpaa ensisijaisena. Toinen näkökanta muotoon ja merkitykseen kos- 
kee sitä, oletetaanko kielen käytön taustalle jonkinlainen kielijärjestelmä 
ja käytön ja systeemin välille vastavuoroinen suhde. Sitä käsitystä, että 
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kielen käytön taustalla on oma symbolinen (platoninen) todellisuutensa, 
joka ohjaa kielenkäyttöä, kutsutaan symbolirealismiksi. Se eroaa forma- 
listien mentalistisesta kannasta, jossa kielioppi siis nähdään viime kä- 
dessä osana ihmisen kognitiivisia prosesseja ja generatiivisessa kielen- 
tutkimuksessa vieläpä palautuvan osaksi biologiaa (perimää). 
Kielentutkimusta voi hahmottaa erilaisten heurististen mallien kautta. 
Kuviossa 19 kieltä jäsennetään vertikaalisesti abstraktisuuden ja holisti- 
suuden avulla (vrt. kuvioon 18). Horisontaalinen suunta rakenne-käyttö 
vastaa taas karkeasti jakoa muotoon ja merkitykseen. Molemmilla akse- 
leilla voi liikkua myös kohtisuoraan (ks. kuvion 19 nuolet): Horisontaali- 
sella rakenne-käyttö-akselilla liike vertikaalisesti tarkoittaa käytön osalta 
merkityksen tarkastelua joko semantiikkana (kenttä 2) tai pragmatiikka- 
na (kenttä 3). Vastaavasti rakennetta voi tarkastella rakenneskeemoina 
(kenttä 1) tai konkreettisina rakenneskeemojen instansseina eli esiin- 
tyminä (kenttä 4). Samalla tavoin vertikaalisella järjestelmä-esiintymä- 
akselilla liike horisontaalisesti tarkoittaa järjestelmän kuvausta joko 
formaalina (hyvämuotoisten) rakenteiden systeeminä (kenttä 1) tai kon- 
ventionaalistuneena semantiikkana (kenttä 2, esim. kielen muodon va- 
kiinnuttamana käsiterakenteiden järjestelmänä). Yhtä lailla esiintymien 
kuvaus voi keskittyä niiden kontekstuaalisen käyttöfunktion kuvaami- 
seen (kenttä 3) tai siihen, miten esiintymät ilmentävät kielen rakenne- 
potentiaalia, esimerkiksi morfologista variaatiota (kenttä 4). 


Järjestelmä määrittelee järjestelmä Järjestelmä määrittelee 
hyvin muodostuneet <---l--- > yksiköiden käyttötavat. 
rakenteet. 

Tw dom. JA 

rakenne 4+ | käyttö 

vo 413 Y 
Rakenteet esiintyvät «3 » 
konkreettisissa E M Ilmaukset ovat 
ilmauksissa. esiintymä kontekstuaalisia. 


Kuvio 19. Kielen rakenteen, esiintymän, käytön ja järjestelmän nelikenttä (sovel- 
taen Nikannetta 2015; 2018, 9—10; ks. myös kuvio 18). 
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Nelikentässä kentät 1 ja 2 edustavat järjestelmälähtöistä kielen- 
kuvausta ja kentät 3 ja 4 esiintymälähtöistä kuvausta. Kenttä 1 koskee 
järjestelmälähtöistä muotoperustaista formalismia. Perustyyppinen 
tätä edustava tutkimus on generatiivinen kielenkuvaus (erit. varhainen 
transformatiivis-generatiivinen kielentutkimus) ja sitä vastaavat kielen- 
kuvaukset, joiden keskeinen tavoite on esittää sääntöformalismi vain 
kielen hyvämuotoisille ja kieliopillisille rakenteille. Semantiikalla on si- 
vuosa tällaisessa kuvauksessa toisin kuin kentän 2 järjestelmälähtöisessä 
funktionalistisessa lähestymistavassa, jossa kieliopillinen kuvaus on 
juuri ennen kaikkea semantiikan kuvausta (esim. kognitiivinen kieli- 
oppi). Kenttä 3 edustaa esiintymälähtöistä funktionalistista lähestymis- 
tapaa, jossa ilmauksia tarkastellaan esiintyminä konkreettisissa käyttö- 
yhteyksissään. Ilmaukset ovat kontekstissaan, ja samalla ne itsessään 
luovat ja rakentavat kontekstia. Kieltä tarkastellaan ennen kaikkea vuoro- 
vaikutuksellisena toimintana ja usein yhtenä osana muuta laajempaa 
sosiaalista toimintaa. Tällaista tutkimusta edustavat muun muassa kes- 
kustelunanalyysi, vuorovaikutuslingvistiikka, lingvistinen antropologia, 
lingvistinen etnografia ja tekstin- ja diskurssintutkimus (ks. ko. lukuja 
tk.). Kentälle 4 ei löydy suoranaista tutkimusalaa, mutta esimerkiksi 
puhutun kieliaineiston litteroimisessa tai transkriboimisessa kielen ra- 
kenteet saavat kirjallisen ilmiasun konkreettisina esiintyminä. Tämä on 
ennen kaikkea metodista toimintaa. 

Yleisesti ottaen kielentutkimuksen sisällä hajaannusta ja koulukunta- 
eroja aiheuttaa sekä rikastuttavaa tieteenfilosofista keskustelua rikkoo 
oletus siitä, että erilaisten metodien tai teorioiden premissit lähtemät- 
tömästi asettaisivat eri tutkimusnäkökulmat toistensa kanssa pois- 
sulkevaan asemaan. Esimerkiksi hyväksymällä kognitiivisen kielen- 
tutkimuksen keskeiset premissit sulkisi generatiivisen perinteen 
kokonaan pois tai hyväksymällä vuorovaikutuslingvistiikan premissit 
sulkisi kielitajun käytön kokonaan pois. Juuri tällaisten metodologisten 
ajattelutapojen havainnoiminen ja kyseenalaistaminen on kielen- 
tutkimuksen tieteenfilosofian kannalta erittäin hedelmällistä. 
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3.3.2. METODIEN SUHTEISTA: INTUITIO JA EMPIRIA 

Tieteessä tehdään toisinaan arvottavia eroja erilaisten metodien välille. 
Esimerkiksi kielentutkimuksessa kielitajun varaisen ja empiirisiin me- 
todeihin nojautuvan tutkimuksen välille synnytetään eroja, jotka saa- 
vat helposti koulukuntamaisia piirteitä puolesta ja vastaan (ks. esim. 
Phillips 2009). 

Kielitaju kuitenkin liittyy monella tavalla myös kielitieteen muihin 
metodeihin. Ensinnä monissa tutkimusasetelmissa (esim. psyko- ja 
neurolingvistiset kokeet, ks. Psyko- ja neurolingvistiikka; Kokeellinen 
fonetiikka tk.) kielellinen syöte on usein tutkijan kielitajullaan laati- 
maa. Kyselytutkimuksissa tutkijan laatimat kysymykset nojaavat usein 


kyselyn laatineen tutkijan kielitajuun ja ainakin vastaukset kokonai- 
suutena edustavat kielenkäyttäjien eräänlaista kollektiivista kielitajua 
(ks. Tummers, Heylen & Geeraerts 2005, 229). Myös elisitoinnissa 
voidaan konsultoida suoraan kielenpuhujan kielitajua.5 Kielitaju on siis 
oikeastaan välttämättömänä osatekijänä monessa kielentutkimuksen 
tutkimusmetodissa, ja metodien suhde onkin siksi toisiaan täydentävä. 
Kun metodien käytännöllinen suorittaminen vaiheistetaan, kielitajulla 
on useimmissa metodeissa rooli joko tutkimuksen suunnitteluvaiheessa 
tai tulosten tulkinnassa tai molemmissa. Vain nk. autonominen kielen- 
tutkimus nojaa myös aineistonhankinnassa kokonaisuudessaan 
kielitajuun. 

Kielitajun käsite problematisoitui kielentutkimuksessa oikeastaan vas- 
ta 1960-luvulla sen jälkeen, kun Chomsky (2001 [1965], 2) esitti kieli- 
intuition metodologiset perusteet. Tuohon asti kysymys siitä, miten kie- 
litieteilijä tunnistaa kielen yksiköitä, ei ollut metodologisesti relevantti 
tai edes tunnistettu. Hieman samaan tapaan kuin kysymys siitä, miten 
biologi tunnistaa bakteerin tai fyysikko osaa laskea, ei ollut tutkimus- 
raportissa millään tavalla tarpeellista perustella, kuinka kielentutkijan 
esittämät kieliesimerkit ovat legitiimejä. Tutkimuskohdetta koskeva 
argumentaatio muodosti tieteellisen tutkimuksen ytimen. 

Kielitajua on pohdittu kielitieteen metateoriassa jonkin verran muttei 
vielä riittävästi (ks. Konstenius 2014, 142—152). Schütze (2016) esittää 
erään komputationaalisen teorian. Hän on pohtinut sitä, ovatko kie- 
lellisen rakenteen tai ilmaisun kieliopillisuuden (engl. grammaticality 
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judgement) ja hyväksyttävyyden arviointi (engl. acceptability judgement) 
samoja asioita sekä onko intuitiolla ja introspektiolla käsitteellisiä eroja. 
Kielitajun heikkoutena on pidetty sitä, että se voi olla epäluotettavaa ja 
vaihdella eri puhujien kesken. Se on viime kädessä yksilökohtaista ja 
solipsistista®. 

Chomsky (2001 [1965]) esitti, että kielitaju on ainoa oikea kielitieteen 
metodi. Kielitajun roolia ja metodologista oikeutusta on kritisoitu erityi- 
sesti empiirisesti suuntautuneiden koulukuntien ja tutkimussuuntien 
puolelta. Vastaavasti empiiristen tutkimusten heikkoutena on aineiston 
tietynlainen rajallisuus. Esimerkiksi korpusten heikkoutena on pidetty 
sitä, että ne sisältävät vain niitä kielenilmiöitä, joista korpukset koos- 
tuvat. Tällöin on mahdollista, että esimerkiksi jotain harvinaista mutta 
epäämättä kieleen kuuluvaa ilmiötä ei löydy korpuksesta ollenkaan. Li- 
säksi myös puhutut kielelliset tilanteet sellaisinaan ovat kertaluontoisia, 
ne tavallaan edustavat vain itseään. Tämän kokoelman artikkeleissa on 
pyritty nostamaan esiin myös metodien erilaisia rajoitteita niin, että tut- 
kijan laatima yleistys on rajattu aineiston ja analyysin puitteissa eko- 
logiseen validiteettiin’. 

Korpustutkimusten suuntautumistapojen esitetään usein perustu- 
van kielitajun heikentyvään ja korpusaineiston vahvistuvaan rooliin 
tutkimuksessa. Aineistoesimerkein tuetussa (engl. corpus-illustrated tai 
corpus-exemplified) tutkimuksessa tutkijaa ohjaa ennen kaikkea kielitaju 
ja teoreettisen viitekehyksen synnyttämät kysymykset. Korpusesimerkit 
toimivat lähinnä havaintoaineistona teoreettiselle argumentaatiolle. 
Aineistopohjaisessa (engl. corpus-based tai corpus-oriented) tutkimuk- 
sessa sen sijaan kerätään kielitajun ohjaamana vartavastisesti laaja ai- 
neisto, jota analysoidaan ja josta saadaan jostain ilmiöstä esimerkiksi 
määrällistä tietoa ja teoriaa puoltavia tai kyseenalaistavia tietoja. 
Aineistovetoisessa (engl. corpus-driven) tutkimuksessa taas kielitajulla 
on pienin ennakkorooli. Siinä pyritään siihen, että laajasta aineisto- 
kokonaisuudesta itsestään nousisi teoreettisia ja hypoteettisia kysymyk- 
siä tutkittavaksi (aineistovetoisuuden kritiikistä ks. esim. McEnery, Xiao 
& Tono 2006, 8-11). (Ks. tarkemmin Jantunen 2009.) 

Metodit kehittyvät, ja niitä muun muassa yhdistellään keskenään. 
Esimerkiksi erilaisia kenttämenetelmiä (elisitaatiotekniikoita) voi 
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varioida monin tavoin tutkijan tavoitteiden ja strategian mukaan (esim. 
Cornips & Poletto 2005). Tyypillisen lomakepohjaisen tai suoran suul- 
lisen täsmäkyselyn lisäksi tutkittavan kielen puhujia voi muun muassa 
ohjata erilaisiin vuorovaikutuksellisiin tehtäviin, joissa puhujien huo- 
maamatta todennäköisesti esiintyy tutkijan kaipaamia kielen rakenteita 
tai kielellistä toimintaa niiden aidossa käyttöympäristössä (ks. Kielten 
dokumentointi ja kieliopin kuvaus tk.). Joissain tutkimussuuntauksis- 
sa on myös luonnollista käyttää erilaisia aineistoja ja eri menetelmiä 
saman tutkimuskysymyksen avaamiseen (triangulaatio) (ks. esim. 


Plowright 2011; Creswell 2014; ks. Lingvistinen etnografia toimintayh- 


teisöissä tk.). 

Tutkimus jaetaan vanhastaan myös analyysitavan mukaan määrälli- 
seen ja laadulliseen (ks. myös Johdannon luku 1 tk.). Määrällisessä tut- 
kimuksessa ilmiötä pyritään usein kattamaan ”ylhäältä käsin” ja näin 


hahmottamaan vallitsevaa tilaa kieli-, puhe- tai toimintayhteisössä (ks. 
Määrällinen korpuslingvistiikka; Kysely tk., tilastomenetelmistä kielen- 
tutkimuksessa muuten ks. esim. Luojola 2006; Pitkänen & Kohonen 
1984). Laadullisessa tutkimuksessa lähdetään monesti ”alhaalta käsin” 
tapauksista ja tilanteista ja pyritään hahmottamaan sitä, miten itse toi- 
minnassa syntyy, rakentuu ja heijastuu yhteisö (ks. Laadullinen aineis- 
topohjainen kielentutkimus; Lingvistinen etnografia toimintayhteisöissä 
tk.).$ Esimerkiksi Töttö (2004, 9-17) kuitenkin luopuu koko eronteosta 
määrälliseen ja laadulliseen ja luonnehtii (sosiaali)tutkimuksen yleis- 


jakoa termeillä teoreettinen ja empiirinen. 

Kuvio 20 on sovellus ja mukaelma Tötön (2004, 10) kuviosta, joka 
hieman muokattuna sopii kuvaamaan myös kielentutkimusta. Sen 
ajatuksena on, että tutkimus ei useinkaan jakaudu tarkkarajaisesti 
teoreettiseen ja empiiriseen vaan niitä koskevaa metodiikkaa voi so- 
veltaa yhdessä ja samassa tutkimuksessa tai sitten toinen niistä johtaa 
toiseen. 
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kielenTUTKIMUS on 


EU es 


TEOREETTISTA (havainto)EMPIIRISTÄ 
analyysia, joka perustuu analyysia, joka perustuu 


tai sitä ja 


luonnolliseen ja hankittuun 


aikaisempaan tutkijan omaan : MEN 
p 5 havainnointiin tal | kieliaineistoon 


tutkimukseen ajatteluun 


= < 


mikä usein pitää sisällään tai johtaa 


ja 


Kuvio 20. Kielentutkimuksen jakautuminen (soveltaen Töttöä 2004, 10). 


Yleisesti ottaen tutkimuksenteko on enemmänkin kulkemista kehitty- 
vän kysymyksenasettelun johdattelemana jollakin polulla tai kuvion 20 
ilmentämällä kehällä, jolla ei välttämättä ole periaatteellistakaan pääte- 
pistettä. Jos hyväksytään kielentutkimuksen monimenetelmäisyys alana 
ja ajatus, että kaikkia metodeja tarvitaan, niin herää aiheellinen kysy- 
mys, ovatko tiukat metodiset erottelut aina tarpeellisia. Lisäävätkö ne 
aina ymmärrystä metodeista ja metodologiasta tavalla, joka auttaa kehit- 
tämään niistä entistä parempia, vai aiheuttavatko luokittelut pikemmin 
tiukoista koulukuntaeronteoista koituvia haittoja? 


3.3.3. KIELI, AIKA, PAIKKA JA IHMINEN 

Kieli ja kielentutkimuksen jonkin suuntauksen siitä lohkoma tutkimus- 
kohde ovat aina erottamattomassa suhteessa aikaan. Kieli on olemassa 
ajassa, ja siksi kielentutkimuksen tulee pohtia, miten käsitteellistää ai- 
kaa ja kielen suhdetta siihen. 

Klassisen jaon kielentutkimuksen suhteesta aikaan on esittänyt 
Ferdinand de Saussure (2014 [1916], 170-195) jaollaan staattiseen ja 
evolutiiviseen tieteeseen. Tätä kuvaa kuvio 21a. Siinä akseli ab kuvaa 
samanaikaisuutta. Se koskee sellaisia asioita ja ilmiöitä, jotka ovat ole- 
massa yhtäaikaisesti tai samassa ajassa. Aikaa ei ole kuitenkaan tällä 
akselilla täsmällisesti määritetty. Kielentutkimuksessa tätä on vastannut 
synkroninen tutkimus. Vastaavasti akseli cd kuvaa peräkkäisyyttä, ja sillä 
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voidaan tarkastella jotakin akselille ab sijoittuvaa ilmiötä eri fysikaalisi- 
na hetkinä tai eri synkronisissa systeemeissä. Tätä on vastannut kielen- 
tutkimuksessa diakroninen tutkimus. Käsitteellisen eronteon synkro- 
niseen ja diakroniseen kielentutkimukseen esittikin eksplisiittisesti 
ensimmäistä kertaa juuri de Saussure (2014 [1916]). 

Yksinkertaistaen synkronisessa kielentutkimuksessa tutkitaan kielen 
yhtenäiseksi hahmotettua tilaa jollakin ajan hetkellä. Tämä tila voi si- 
joittua johonkin historialliseen aikaan (esim. myöhäiskantasuomi) tai 
nykyhetkeen (esim. suomen kirjoitettu yleiskieli). Aika käsitetään tällöin 
yleensä abstrahoituna ja ikään kuin pysäytettynä ja etäännytettynä. Kie- 
len tila on eräänlainen kohtisuora leikkaus fysikaalisesta aikajanasta, ja 
sen ajatellaan koskevan yleensä kieltä kokonaisuudessaan järjestelmänä. 
Vastaavasti diakroninen kielentutkimus keskittyy kielen muutokseen 
ajan funktiona. Tämä tapahtuu yleensä vertailemalla kielen tiloja eri 
synkronisina hetkinä. (Ks. Historiallinen ja vertaileva kielentutkimus tk.) 


C B (sosiaalinen) 


a) b) 
A B C D (fysikaalinen) 


A (mentaalinen) 


Kuvio 21. (a) Tieteiden akselit de Saussuren (2014 [1916], 171) mukaan; 
(b) konventionaalinen aikajana (cd = fysikaalinen taso) ja synkroninen leikkaus 
(a = mentaalinen taso, b = sosiaalinen taso) (vrt. kuvio 15). 


Vaikka tällaisissa kielitieteen aloja selittävissä malleissa käsite aika toi- 
mii heuristisesti erilaisten kielentutkimuksen lähestymistapojen eroja 
selvennettäessä, ei tule kuitenkaan unohtaa, että aika itsessään ei ole 
ontologisesti mitenkään ongelmaton käsite. Kantilaisessa teoriassa aika 
muodostaa ihmisen tietoisuuden ja havainnon ennakkoehdon ja raken- 
teen: ihminen voi havainnoida ja ajatella vain ajassa. 

Arkisen aika-käsitteen kautta voidaan kuitenkin kuvata kielellis- 
tä tapahtumista ja muuttumista. Kuviossa 21b, jota de Saussure ei 
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sellaisenaan itse esitä, akselisto kuviossa 21a on käännetty niin, että 
akseli cd on horisontaalinen ja vastaa (usein länsimaisessa ajattelussa) 
konventionaalisesti esitettyä aikajanaa tai -nuolta kuvaamassa fysikaalis- 
ta aikaa. Akseliin cd kiinnittyvät fysikaalisessa ajassa aikapaikkaisesti ja 
kollektiivisesti ilmenevät ja kehittyvät tapahtumat. Välittömästä akselista 
cd irtautuvat asiat ovat tavalla tai toisella abstraktioita. Abstrahoinnin 
suunta cd:stä kohti b:tä kuvaa sosiaalista ja suunta kohti a:ta mentaalista 
(vrt. kuvio 15).? Myös nämä ovat toki ajallisia, mutta niitä ei voi suoraan 
ja kollektiivisesti havainnoida ajallis-paikallisesti kuten akselille cd si- 
joittuvia ilmiöitä. Mentaalinen ilmenee suoraan vain tietoiselle yksilölle 
itselleen, kun taas muille se ilmenee epäsuorasti. Myös sosiaalinen nor- 
mien tai konventioiden maailma ilmenee vain epäsuorasti. Havainnot 
koskevat siis primaaristi vain akselia cd. Akselien leikkauspiste on kä- 
sitteellinen nyt-hetki, jolloin suunta c:hen on historiaa ja suunta d:hen 
tulevaisuutta. Seuraava esitys kytkeytyy kuvioon 21b. 

Luonnollisesti selvin suhde aikaan on kaikella kielen muuttumista 
ja tämän muutoksen yleisiä periaatteita kuvaavalla historiallisella tut- 
kimuksella. Tällöin ajallinen ulottuvuus on usein kymmeniä, satoja tai 
jopa tuhansia vuosia. Aikavälejä voidaan periodisoida ja kieliä tai kielen 
esi- ja kantamuotoja nimetä (esim. varhais-uusenglanti noin 1500-1710, 
indoeurooppalainen kantakieli yms.). Kielten kirjoitetun historian ai- 
kana on mahdollista pysytellä c:llä absoluuttisissa ajoissa tai arvioissa 
niistä ja tutkia esimerkiksi jonkin kieliopillisen ilmiön reaalista ilmen- 
tymistä ja kehittymistä ajan saatossa säilyneiden tekstien perusteella 
(ks. Näkökulmia filologiseen tutkimukseen tk.). Tämä mahdollistaa 
myös holistisemman historiallisen sosiolingvistisen tarkastelun. Koska 
kielen muutos on yleensä aina vähittäistä, sen hahmottaminen synkro- 


nisista ilmenemisistä on kuitenkin enemmän tai vähemmän teoreet- 
tista abstrahointia. (Ks. Historiallinen korpuslingvistiikka tk.; Nyman 
2000.) Tällainen tutkimus voi pysytellä yhden kielen kehityskaaren si- 
sällä (esim. muinaisenglannista nykyenglantiin) tai kuvata kehitystä äiti- 
kielestä sisarkieleen (esim. vulgaarilatinasta italiaan). Tutkimuksen to- 
teutettavuuteen vaikuttaa se, kuinka pitkältä aikaväliltä, kuinka tiheästi, 


kuinka paljon ja millaisista tekstilajeista tekstiaineistoja on käytettävissä. 
Tietotekninen korpustyö ja tilastolaskenta toimivat luonnollisina apuina. 
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Kielten kirjoittamaton historia, jota historiallis-vertaileva tutkimus 
tarkastelee, pyrkii kurottamaan yleensä kielen varhaishistoriaan. Se voi 
olla historiaa, josta reaalista kirjallista todistusaineistoa on hyvin niu- 
kasti (esim. tuohikirjoituksia tai muita kielen muistomerkkejä) tai ei 
ollenkaan, tai tunnetun historian takaista esihistoriaa ennen kirjoitus- 
järjestelmiä ja kirjoitettua kieltä. Kielen esihistoriaa pyritään kartoitta- 
maan pääasiassa vertailemalla eri synkronisia kieliä toisiinsa ja muodos- 
tamalla tämän perusteella rekonstruktioita. Tällöin selvitellään muun 
muassa kielten sukulaisuussuhteita, kielikuntaluokitteluja, lainasana- 
lähteitä ja -kerrostumia ja yksittäisten kielten kehittymistä ja vaiheita 
sekä hahmotellaan kantakieliä ja erilaisia ajoituksia (ks. Historiallinen ja 


vertaileva kielentutkimus tk.). Tällainen tutkimus (esim. äännehistoria) 
kuvaa esimerkiksi sukukielivertailun perusteella teoretisoituja äänteiden 


ja äännejärjestelmien rekonstruktioita, joita voidaan suhteuttaa abso- 
luuttisiin aikoihin usein vain muiden reaalitieteiden (esim. arkeologia, 
kansatiede, migraatiotutkimukset) avulla. Muuten kyseessä on esimer- 
kiksi kantakielten ajoituksia ajatellen ajallinen relatiivisuus, joka suh- 
teuttaa eri abstrahoituja rekonstruktiotasoja (eli kielen synkronisia leik- 
kauksia) kronologiseen järjestykseen. Lisäksi varhaiset rekonstruktiot, 
esimerkiksi perimmäisimmät kantakielet, ovat vieläpä rekonstruktioiden 
rekonstruktioita eli viime kädessä hyvin teoreettisia käsitteitä. 

Myös sisäinen rekonstruktio paljastaa teoretisoidun synkronisen 
kielijärjestelmän sisällä relatiivisesti kronologisia ilmiöitä. Se kuvaa ta- 
vallaan historiallista näennäisaikaa synkronisen systeemin sisällä (reaali- 
ja näennäisajasta ks. Sosiolingvistiikka tk.). Sekä historiallis-vertaileva 


metodi että sisäinen rekonstruktio edustavat teoretisointia, joka etään- 
nyttää c:stä. Usein kyse on yksittäisten ilmiöiden vertailusta kahden 
tai useamman abstraktin synkronisen tason kesken. Erikseen on vielä 
mainittava nimistön asema keskeisenä kielen historiaa säilyttävänä osa- 
alueena (ks. Nimistöntutkimus tk.). 

Lähemmäs nykyhetkeä eli akselien leikkauskohtaa sijoittuva tai nyky- 


hetkeen suhteutettu kielentutkimus voi myös olla perspektiiviltään his- 
toriallista. Tällöin kuitenkin aikajänteet ja periodit ovat huomattavasti 
lyhyempiä (esim. joitain kymmeniä vuosia) ja yleensä vertaillaan yhtä- 
aikaisesti elossa olevien sukupolvien kieltä. Kieli myös kiinnitetään ajan 
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ja paikan ohella yhä kiinteämmin eri tavoin määrittyviin ihmisryhmiin. 
Sosiolingvistiikan reaaliaikatutkimukset kiinnittyvät absoluuttiseen 
aikaan noin 10-20 vuoden ajalta tai tiheämmin. Paneelitutkimuksessa 
samoja yksilöitä tutkitaan eri aikoina (esim. 10 vuoden välein). Trendi- 
tutkimuksessa tutkittavat muuttujat säilyvät mutta tutkittavat henkilöt 
vaihtuvat eri aikoina (esim. 10 vuoden välein). Koska perinteinen piirre- 
variaatioon keskittyvä sosiolingvistiikka tarkastelee kielenulkoisin muuttu- 
jin (esim. ikä, sukupuoli, asuinpaikka) määrittyvien ihmisryhmien kieltä, se 
abstrahoi kuvauksen sosiaaliseen tasoon (b). Yksilön idiolektin muuttumi- 
sen tai muuttumattomuuden tutkimus mahdollistaa myös tapauskohtaises- 
ti yksilön kieltä ja jopa mentaalikielioppia koskevien oletusten tekemisen 
(a). Näennäisaikatutkimus, jossa ennustetaan seuraavan sukupolven kielen 
muuttumista samaan aikaan elossa olevien edellisten sukupolvien kielen 
perusteella, tarjoaa hypoteeseja jo tulevaisuuden kielestä. (ks. Sosiolingvis- 
tiikka; Haastattelu aineistonkeruun metodina sosiolingvistiikassa tk.) 
Tulevaisuuskin (d) on kielentutkimukselle relevanttia. Teoreettises- 
sa kielentutkimuksessa tämä näkyy esimerkiksi kieliopillistumisen eli 
grammatikalisaation tutkimuksessa. Siinä esitetään kieliopilliset muutos- 
prosessit peräkkäisinä osatapahtumina ja usein jatkumomaisena. Niistä 


esitettyjä teoreettisia yleistyksiä voi pitää hypoteettisina ennusteina vas- 
taavanlaisista muutoksista tulevaisuudessa. Tähän liittyy myös kielten 
universaalien tutkimus, sillä esitettyjen kieltä koskevien yleistysten aja- 
tellaan vaikuttavan myös tulevaisuudessa puhuttavissa kielissä. Tällaisina 
kieliopillistumisen ja kielen typologisten universaalien voi ajatella edusta- 
van ennustavan selittämisen malleja tai hypoteeseja kielentutkimuksessa. 

Kuitenkin konkreettisemmin ja pysäyttävämmin tulevaisuus näkyy 
kielisosiologiassa esimerkiksi kielten katoamisessa. On arvioitu, että 
kuluvan satavuotisjakson aikana vähintään puolet ja jopa 90 % maail- 
man arviolta noin 6 000-7 ooo puhuttavasta kielestä lakkaisi olemasta 
(Bradley & Bradley 2002). Kun jotain kieltä puhuvat yksilöt kuolevat 
(a) eikä geneettistä ja kielellistä uusiutumista tapahdu riittävästi, kielen 
sosiaalinen asema on heikko eikä tilannetta pystytä tai ehditä kääntä- 
mään paremmaksi (b). Tällöin kokonainen kieli saattaa lakata olemasta. 
Usein kyseeseen tulee sekin, että puhujien kielitaito alkaa rappeutua ja 
päädytään kielenvaihtoon. Tällaisen tapahtuman myötä menetetään aina 


146 MARKUS HAMUNEN JA REETTA KONSTENIUS 


kunkin kielen kohdalla periaatteessa mittaamaton määrä tietoa ja ihmi- 
sen kulttuuriperimää. Siksi kielellis-kulttuurisen monimuotoisuuden 
korostamisen tulisi nousta yhdeksi kielentutkimuksen globaaleista po- 


liittisista tavoitteista. (ks. Antropologinen lingvistiikka; Kielikontaktien 
tutkimus; Kielten dokumentointi ja kieliopin kuvaus tk.) 


Paikkaa tai kielialueen sijaintia voi pitää ajan rinnalla toissijaisena 
kieltä määrittävänä tekijänä erityisesti historiallis-vertailevassa suun- 
tauksessa, sillä kielet ja kieliyhteisöt voivat aikojen saatossa alueellisesti 
laajentua, supistua tai vaihtaa maantieteellistä paikkaansa. Sen sijaan 
esimerkiksi kielikontaktien tutkimus lokalisoi kieliä yhtä lailla ajallisesti 
kuin paikallisesti (ks. Kielikontaktien tutkimus tk.). Paikallisesti lähek- 


käin ja luonnollisessa yhteydessä olevien erikielisten kieliyhteisöjen kon- 
taktit synnyttävät esimerkiksi sellaisia ilmiöitä kuin kielijatkumot (esim. 
Pohjois-Afrikan, Arabian niemimaan ja Lähi-idän arabian murteet), 
kieliliitot (esim. Balkan), pidgin- ja kreolikielet ja lingua francat sekä 
pysyvät kielenvaihdot ja tilanteiset koodinvaihdot. Paikkaan viittaa myös 
termi areaaliset piirteet. Samoin ekolingvistiikka tutkii sitä, miten muun 
muassa kieliyhteisön fyysinen ympäristö näkyy kielessä (ks. Antropo- 
loginen lingvistiikka tk.). Kontaktien historiallinen aspekti näkyy synk- 


ronisesti kielissä esimerkiksi lainasanakerrostumina (substraatit). On 
kuitenkin hyvä muistaa, että paikka ei sekään ole kuitenkaan itsestään 
selvä ontologinen kategoria vaan käsitteellinen konstruktio, jonka jo- 
kaisen tutkijan on omassa tutkimuksessaan määriteltävä aina erikseen. 

Kielen systeeminen luonne ja sen erilainen (paikallinen, tilantei- 
nen, roolittainen, ihmisryhmittäinen jne.) luonnollinen variaatio (ks. 
kuvio 16) sisältää potentiaalisia muutoksen siemeniä, joten historial- 
linen perspektiivi on koko ajan piilevä osa kielen elämää. Se pakottaa 
määrittelemään esimerkiksi juuri variaation taustakäsitteitä uudel- 
leen kielisysteemin ulkoisin tekijöin (esimerkiksi diskurssirooli, iden- 
titeetti, indeksisyys). Näin toimivaa tutkimusta edustavat esimerkiksi 
keskustelunanalyysi, tekstintutkimus, diskurssintutkimus, lingvistinen 
etnografia ja antropologinen kielentutkimus (ks. ko. lukuja tk.). Lisäksi 
osassa kielentutkimusta merkitys nähdään ennen kaikkea semioosina 
eli merkitsemistapahtumana koodin sijaan ja usein osana kulttuurisia 
ja ideologisia taustoja, jotka ovat historiallisia. Tutkijan on tällöinkin 
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mielekästä tarkistaa käyttämänsä taustateorian ontologisia oletuksia. 
Esimerkiksi funktionaalisella sosiosemiotiikalla (esim. Halliday 1978), 
kognitiivisella semiotiikalla (esim. Zlatev 2012; Sinha 2014) ja evolutii- 
visella semiotiikalla (esim. Cariani 1998) on erilaiset käsitykset todelli- 
suuden luonteesta. Kun lisäksi de Saussuren kaksipaikkaisesta merkistä 
siirrytään monipaikkaisiin merkkeihin (esim. Peirce, Derrida, Kristeva), 
siirrytään usein myös noiden merkkien merkityksiin vaikuttaviin — usein 
dialektisiin — prosesseihin, joita ei voi jättää tulkinnan ulkopuolelle. 
Lukuun ottamatta ehkä yksilökielen eli idiolektin tutkimusta ajan, pai- 
kan ja ihmisen teoretisointi on koskenut valtaosin sosiaalista tasoa (b). 
Sellainen reaaliaikainen tutkimus, jossa pyritään kokeellisesti selvittämään 
esimerkiksi puhujan kielen tuotto- tai kuulemiskykyä, kognitiivista hah- 
mottamista tai aivojen neurologista toimintaa, pysyttelee usein käytännön 
syistä hyvin pienen aikaikkunan sisällä (ks. Kokeellinen fonetiikka; Psyko- 
ja neurolingvistiikka tk.). Tutkimusaineisto on tällöin joistain sekunneista 


millisekunteihin. Saatavan aineiston varassa on mahdollista esittää malle- 
ja kieltä koskevan aivotoiminnan edustumisesta (cd) sekä viime kädessä 
arvioida teoretisointeja mentaalikielioppimallien (a) psykolingvistisesta 
realistisuudesta. Frityisesti perinteiset ja uudemmat kielioppikuvaukset 
ja kielenkuvausmallit ovat tavallisesti myös ikään kuin ajattomia (atempo- 
raalisia). Ne kuvaavat koko kielioppijärjestelmää tai jotakin sen osaa usein 
joko sosiaalisesti vallitsevana (b) tai sellaisena kuin sen oletetaan tai teo- 
retisoiden esitetään edustuvan kielenpuhujien mielessä (a) tämän omak- 
suttua sosiaaliset normit (ks. Kieliopin tutkimus ja kielioppiteoriat tk.). 


3.4. Kielen tasot ja tutkimuksen monimenetelmäisyys 


Kielentutkijan on tutkimuksessaan jotenkin määriteltävä luonnollinen 
kieli, tutkimuksensa kohde. Tässä tehtävässä on mielekästä muistaa, 
että ihmiselle ilmenevä ja ihmisen käsitteistämä todellisuus sekä tutki- 
muksessa käytetyt muuttujat, kategoriat, rakenteet ja muodot eivät ole 
välttämättä sama asia kuin ontologia. Luvussa 3.2.3. käsiteltiin tutkimus- 
kohteen ontologisointia: tutkijan taustateoria vaikuttaa siihen, millaisen 
eksistenssin hän osoittaa tutkittavalle ilmiölle. 
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Tutkimuksessa on luonnollista käsitteellistää osa kulloinkin tarkas- 
teltavasta maailmasta ja esittää erilaisia painotuksia sille, mitä puolta 
kielestä halutaan ensi sijassa tarkastella: kielen konventionaalistunutta 
koodin rakennetta tai sisältöä (eli symbolisen yksikön muotoa tai mer- 
kitystä), kieltä kokonaisena abstraktina järjestelmänä tai kielen raken- 
teiden esiintymiä käytössä ja näiden funktioita ja tulkintoja vai kieltä 
tietona tai käyttäytymisenä osana muuta inhimillistä toimintaa. Kieltä 
voidaan myös suhteuttaa käsitteistettyyn aikaan ja paikkaan sekä sitä 
käyttävään ihmiseen eri tavoin (ks. Johdannon luku 3.3.3. tk.). 

Kuviossa 22 esitetään karkea kuva kielentutkimuksen menetelmien 
tai suuntausten ja kielen sekä eräiden muiden tieteiden suhteista. Kuvio 
ei ole kattava, ja sitä on syytä tulkita heuristisena mallina, jolla voidaan 
yksinkertaistaa monimutkaista ja monitasoista suhteiden järjestelmää. 
Kuvio muodostuu sisäkkäisistä ympyrän kehistä, joiden rajat eivät ole jyr- 
kät. Keskiössä on kieli primaarina tutkimuskohteena ja sen jakautuminen 

fysikaaliseen, mentaaliseen ja sosiaaliseen tasoon (vrt. kuviot 15 ja 21b).'? 
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Kuvio 22. Kielen tasot, tutkimusmenetelmät ja kielentutkimuksen suuntaukset. 
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Kielitieteen menetelmia ja kielentutkimuksen suuntauksia ei voi usein- 
kaan selvästi ja yksioikoisesti erottaa toisistaan. Suuntauksissa kiteytyy 
usein jonkin menetelmän perinteinen tietämys ja tällä metodilla saa- 
dusta tiedosta jalostunut kielikäsitys ja tieteellinen teoria. Jotkin metodit 
myös käytännössä hahmotetaan samalla suuntauksiksi (esim. historiallis- 
vertaileva metodi tai suuntaus). Suuntausten tietynlainen toissijaisuus 
koskee niiden tieteensosiologista jäsentymistä, paradigmatisoitumista, 
erilaisia ohjausvaikutuksia (esim. mikä on kulloinkin arvostettavana 
pidettävää ja tavoiteltavaa tutkimusta, prominenttien tutkijoiden valtaa 
jne.) ja esimerkiksi yksittäisten tutkijoiden ja opiskelijoiden asemaa ja 
sosiaalistamisprosessia tiedeyhteisössä. Tällaiset seikat ovat enemmän 
tiedeyhteisöä jäsentäviä tekijöitä ja viime kädessä toissijaisia tekijöitä tut- 
kimuksen ytimen (tiedonkohde, metodi ja metodologia) rinnalla, vaikka 
niillä onkin merkittävää vaikutusta myös tehtävään tutkimukseen (esim. 
tutkimustrendien tai pitkäaikaisten tutkimusperinteiden muodossa). (Ks. 
esim. Karlsson 1975; Kelomäki 2009.) Tieteensisäisen järjestäytymisen 
lisäksi tutkimuksen muotoutumiseen vaikuttavat toki myös tieteen ul- 
koiset, yhteiskunnalliset tekijät ja esimerkiksi kielipolitiikka (esim. Lap- 
palainen, Sorjonen & Vilkuna 2010). Tähän liittyy se, kuinka kieli yhteis- 
kunnassa yleisesti ymmärretään, millainen merkitys sille annetaan, mitä 
tutkimukselta toivotaan ja millaisen tutkimuksen katsotaan kulloinkin 
olevan tässä suhteessa tuottavinta. Nämä seikat voivat vaikuttaa myös 
paikallisesti painotusten siirtymiin tieteenalan sisällä. 

Tutkijan on mielekästä analysoida oman metodinsa ja taustateoriansa 
käsityksiä kielestä (esim. kieli järjestelmänä, kieli toimintana yms.). Il- 
miöihin pureutuvat kysymyksenasettelut ohjaavat metodivalintaa, minkä 
seurauksena kieleen kohdistuu jokin näkökulma, jonka voi pelkistää 
tutkimuskohtaisesti joksikin kielikäsitykseksi. Eri suuntausten tai me- 
todien piirissä voi olla esimerkillisiä mallitutkimuksia eli eksemplaareja, 
joita voidaan seurata tutkimuksenteossa. Tällainen oli aikanaan esimer- 
kiksi E. N. Setälän vuonna 1891 ilmestynyt teos Yhteissuomalainen äänne- 
historia, joka toimi pitkään fennougrististen äännehistoriakuvausten 
malliesityksenä ja joka on monessa suhteessa pätevä yhäkin. Yleisesti 
mallitutkimuksissa on aina vaarana se, että ne sitovat tutkimusalaa lii- 
kaa tai niiden sisältämiä virheitä toistetaan uusissa tutkimuksissa. 
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Kielitieteellisten teorioiden sijoittaminen ontologisiin näkemyksiin 
on toisaalta hankalaa siksi, että kielitieteen metateoreetikot eivät usein- 
kaan ole määritelleet omia ontologisia käsityksiään selvästi suhteessa 
käytyihin koulukuntakeskusteluihin. Toisaalta näissä määritelmissä on 
usein sellaisia ristiriitaisuuksia, jotka tekevät ko. teoriasta jollain tavoin 
sisäisesti ristiriitaisen. Esimerkiksi Langacker (1987, 20, 157, 178) käyttää 
termejä holismi ja emergenssi mutta toisaalta olettaa, että kognitiiviset 
ilmiöt voidaan redusoida eli palauttaa neurokemialliseksi toiminnaksi 
(emergenssistä ks. Määttä, Nieminen & Pälli 2000). Hän tekee siten 
kolme keskenään ristiriitaista sitoumusta (ks. Kenttä 2003, 78). Edes toi- 
siaan hyvin lähellä olevien teorioiden, kuten prototyyppiteorian (Rosch 
1978; 1999) ja kognitiivisen semantiikan (Lakoff & Johnson 1999), 
ontologiset oletukset eivät ole tarkalleen ottaen samat. 


3.5. Lopuksi 


Olemme tässä luvussa kehittäneet yleiskuvaa kielentutkimuksen ken- 
tästä ja kiinnittäneet huomiota joihinkin metateoreettisen tarkastelun 
kannalta keskeisiin käsitteellisiin lähtökohtiin. Tieteenalan moni- 
menetelmäisyys perustuu siihen tosiasiaan, että kielen kaltaista hyvin 
mutkikasta ilmiötä voidaan lähestyä useasta eri tarkastelukulmasta ja 
se voidaan hahmottaa jo perusolemukseltaankin moni-ilmeiseksi (esim. 
kielen fysikaalinen, mentaalinen ja sosiaalinen taso, ks. kuviot 15, 21b 
ja 22). Tällaisen selvittely edellyttää välttämättä usean metodin käyttöä. 
Huomattava on kuitenkin ensinnä se, että kielen käsitteellistäminen 
tutkimustyössä on sikäli aina teoriasidonnaista, että vasta taustateoria 
määrittelee ontologisia sitoumuksia. Toiseksi kielen ontologisointi eli 
kielen olemuksen näkeminen ensisijaisesti yhdenlaisena ei millään 
välttämättömyydellä johda normatiivisesti tietynlaiseen metodologiaan. 
Kielentutkimuksen käytäntö ja sitä kuvaava tieteenfilosofia ovat tois- 
taiseksi pysytelleet melko etäällä toisistaan (ks. kuitenkin esim. Hamu- 
nen, Nieminen, Kelomäki & Dufva 2019). Hyvin toivottavaa olisi, että 
tulevaisuudessa kielentutkimuksen metateoriaa tutkittaisiin enemmän. 
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VIITTEET 


1 Davidsonin käsitys perinteisestä tai vallitsevasta kielentutkimuksesta oli selvästi ennen 
kaikkea chomskylainen generativistinen näkemys kielestä järjestelmänä. 

2 Niin kuin monien filosofien ajatukset kehittyvät ajan myötä, näin kävi myös Popperille. 
Hänen rationalistiseen ajatteluunsa sisältyi hänen myöhäisfilosofiassaan yhä enemmän 
realistisia elementtejä. Popper ei itse käsitellyt tätä dilemmaa omassa ajattelussaan, 
joten tarkkaa selkoa ovat tehneet vasta Popper-tulkitsijat (ks. esim. John Wettersten 
(1992) The Roots of Critical Rationalism). 

3 On hyvä muistaa, että de Saussuren Yleisen kielitieteen kurssi on postuumi julkaisu opis- 
kelijoiden muistiinpanojen pohjalta (ks. Nyman & Suominen 2002). Edellä esitetyn eng- 
lanninkielisen sitaatin suomenkielinen vastine kuuluu näin: ”Merkit, joista kieli koostuu, 
eivät ole abstraktioita, vaan jotakin todella olemassa olevaa. Juuri merkkejä ja niiden 
suhteita kielitiede tutkii. Voimme kutsua niitä tämän tieteen konkreettisiksi olioiksi.” (de 
Saussure 2014 [1916]: 201.) Toisaalla de Saussure luonnehtii merkkiä tähän tapaan: 
”Kieli [langue] on luonteeltaan yhtä konkreettinen asia kuin puhuntakin [parole], ja tästä 
on suurta etua tutkimuksessa. Vaikka kielelliset merkit ovatkin olennaisesti psyykkisiä 
[1], ne eivät ole abstraktioita.” (Mts. 89.) 

4 Lektin käsitteellä (esim. idiolekti, sosiolekti, etnolekti) on sosiolingvistiikassa tarkoitettu 
erilaisia kielen varieteetteja, jotka ovat hahmotettavissa ilmiasultaan tietynlaisiksi kielen 
muodoiksi (esim. aluemurre). 

5 = Elisitointi (elisitaatio, kirvoittaminen) on kielentutkimuksessa yhteisnimitys sellaisille 
menetelmille, joissa kielenpuhujat pyritään saamaan tuottamaan tutkijan toivomia kie- 
len rakenteita tai ilmauksia tai ylipäätään toivottua kielellistä toimintaa joko tietoisesti 
tai tiedostamattomasti. 
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6 Solipsismilla viitataan siihen, että vain yksilön tietoinen tajunta ja mielensisällöt ovat 
ainoita täysin varmoiksi tiedettyjä asioita. 

7 Ekologinen validiteetti tarkoittaa sitä, että tutkimuksen pääargumentti populaation suh- 
teen on oikeutettu aineiston ja metodin kautta. Jos esimerkiksi on tutkittu ylioppilas- 
kirjoituksia, ei tuloksia voida yleistää kaikkiin tekstilajeihin ja ikäluokkiin. 

8 Jako mikro- ja makrotutkimukseen kuvaa tätä eroa jollain tavoin siedettävästi, mutta 
sekin on dikotomia, jonka voi helposti tulkita liian yksioikoisesti. 

9 Kuvio 21b yhdistää oikeastaan kaksi asiaa: de Saussuren esittämän kuvion (ks. kuvio 
21a) käännetty akselisto yhdistetään kuviossa 15 esitettyjen kielen heurististen olemus- 
tasojen kanssa. 

10 Tasojen sijaan voisi ehkä puhua kielen olomuodoista, jolloin terminologinen ero tulisi 
selvemmäksi: kielen olomuodot (fysikaalinen, mentaalinen, sosiaalinen), kielen (kuvaus-) 
tasot (perinteinen jako fonologiaan, morfologiaan ym.) ja kielen kanavat (ilmeneminen 
kirjoitettuna, puhuttuna, viitottuna). Epäselvyyden vaaraa ei tässä yhteydessä kuiten- 
kaan ole. 
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4. Kielitieteen etiikka — hyvä tutkimus 
murroksessa 


Reetta Konstenius 


Tieteellisen tutkimuksen etiikka on nuori tutkimusala. Alle sadassa 
vuodessa se on kehittynyt yleispätevistä arvolauselmista alakohtaisiin 
normikokoelmiin, joista nyt ollaan siirtymässä digitaalisen ajan mikro- 
etiikkaan. Mikroetiikka tarkoittaa tutkimuskohtaista eettisten huolen- 
aiheiden tiedostamista ja tutkimukseen integroitua moraalifilosofista 
pohdintaa. Se on alhaalta ylös, datasta ja tutkimusasetelmasta kumpua- 
vaa eettisesti motivoitua vuorovaikutusta niin tutkittavien kuin datankin 
kanssa (esim. ”Kokevatko osallistujat tämän virtuaalisen tilan yksityise- 
nä vai julkisena?”). Makroetiikaksi nimitetään ylhäältä alas kategorisesti 
sovellettavia yleisiä tutkimuseettisiä toimintakoodeja. Tällöin sovelletaan 
klassisia tutkimuseettisiä normistoja, joita yliopistot, tutkimuseettiset 
neuvottelukunnat tai alan yhdistykset ovat kirjanneet (esim. ”Älä vääris- 
tele, valehtele tai sepitä tutkimustuloksia”). 

Tässä luvussa tarkastellaan ensin etiikan käsitettä ja laajan vastuun 
etiikan historiallista kehitystä. Tämän jälkeen käsitellään varsinaista 
tutkimusetiikkaa, käsityksiä ihmisoikeuksista ja kielitieteen suhdetta 
makroeettisiin koodeihin. Lopuksi selvitetään verkkoon kohdistuvan 
kielitieteen ja teknologian aiheuttamia muutostrendejä tutkimusetiikassa. 

Tämä luku ei tarjoa kaikkialla pätevää tutkimuseettistä normistoa 
kielentutkijan arkipäivään, sillä tutkimusta muiden kuin biolääke- 
tieteellisten alojen eksperimenttien etiikasta on olemassa varsin 
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rajallisesti (ks. yleisesti Clarkeburn & Mustajoki 2007). Tämä johtuu siitä, 
että etiikantutkimus on yleisesti nuori ala, ja kielitieteen etiikantutkimus 
on vielä sitäkin nuorempaa. Kysymys siitä, koskeeko humanistisiakin alo- 
ja tutkimuseettinen koodisto, esitettiin oikeastaan vasta 2000-luvulla (ks. 
Hallamaa, Launis, Lötjönen & Sorvali 2006). Kun nykyisin Suomessa 
julkaistaan vuosittain keskimäärin noin kymmenen biotieteiden etiikkaa 
koskevaa väitöskirjaa (ks. Länsimies-Antikainen 2008) ja alaa voi opis- 
kella monessa yliopistossa ulkomailla, kielitieteen etiikan väitöskirjoja ei 
toistaiseksi ole juurikaan julkaistu enempää Suomessa kuin ulkomailla- 
kaan. Erot eri aloilla tehdyssä etiikan tutkimuksessa johtavat epäsuhtaan 
etiikkaa koskevan tiedon laadussa ja määrässä (Konstenius 2014). 

Tässä luvussa esiin tulevat huomiot kielitieteen etiikasta ovat peräi- 
sin erilaisista kenttämetodioppaista sekä kielitieteellisten yhdistysten ja 
julkaisujen omilta internetsivuilta. Suomessa ainoaa kielitieteen etiik- 
kaa käsittelevää väitöskirjaa, Konsteniuksen (2014) teosta Empiria, eks- 
perimentti ja etiikka, on tässä luvussa referoitu runsaasti. Kirjallisuuden 
niukkuus implikoi sitä, että alalla ei ole syvällistä julkista ja vakiintunut- 
ta tutkimuseettistä pohdintaa. Siksi keskustelua kielitieteen etiikan koo- 
distosta ei voi tässä referoida. Tavoitteena onkin nyt tuoda esille erilaisia 
puolia, näkemyksiä ja ongelmia kielitieteen etiikassa siten, että kielen- 
tutkimuksen yhteisö voi kollektiivisesti — jokainen oman tutkimuksensa 
osalta — vastata tutkimuseettisiin kysymyksiin. Juuri tämä onkin nykyi- 
sen mikroeettisen tutkimuseettisen suuntauksen sanoma: valmiiden 
vastausten sijaan tutkijan on aktiivisesti itse pohdittava ja harjoitettava 
omaan tutkimustyöhönsä kohdistuvaa moraalifilosofiaa. 


4.1. Kielentutkimuksen etiikka informaatioyhteiskunnassa 


Internet on aiheuttanut yhteiskunnallisen murroksen, jota filosofit ovat 
sen vallankumouksellisuudessa verranneet painokoneen keksimiseen 
viisisataa vuotta sitten. Uudet teknologiat ovat mahdollistaneet uusia 
viestintäkeinoja, ja tällä on pitkälle meneviä kerrannaisvaikutuksia, joita 
emme vielä kaikkia tunne. Osa muutoksista vaikuttaa myös kielitieteen 
etiikkaan. 
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Kielitieteen etiikkaa on joiltain osin mielekästä tarkastella juuri sen 
teknologian kautta, johon kieli on sidottu ja jolla kieltä välitetään tai 
tutkitaan. Puhuttua, painettua tai sähköisesti internetistä koottua kieltä 
koskevat tutkimuksessa erilaiset tutkimuseettiset normit. Tämä johtuu 
siitä, että kielen sidos ihmisten oikeuksiin on näissä eri tilanteissa tul- 
kittu erilaiseksi. 

Tutkimusmetodi voidaan tässä kontekstissa ymmärtää tekniikkana, 
työkaluna, jolla uutta tietoa muodostetaan reaalitodellisuudesta. Tässä 
luvussa käsitellään niitä yleisiä normeja, jotka ohjaavat metodin eet- 
tistä käyttöä. Kuten oikeiden työkalujen myös metodien välillä on suu- 
ria eroja, joten niiden aiheuttamat potentiaaliset vahingotkin eroavat 
toisistaan. Siksi niiden käyttöä ohjaavat normistot ovat myös erilaisia. 
Samalla tavalla kuin moottorisahan ja ruuvimeisselin käytössä turva- 
järjestelyjen määrä ja laatu poikkeavat toisistaan, niin eroavat myös 
tutkimustekniikoiden turvallista käyttöä ohjaavat normistot. Näistä 
metodien erityispiirteistä keskustellaan eri metodien yhteydessä tämän 
teoksen eri luvuissa. 

Informaatioyhteiskunnalle on ominaista, että suuri osa sen keskei- 
siä toimintoja — talous sekä sosiaalinen ja poliittinen elämänpiiri — on 
sidoksissa teknologiaan. Nykytutkimus voidaan siksi jakaa online- ja 
offline-tutkimukseen. Online-tutkimusta on kaikki se tutkimus, joka 
suoraan tai epäsuorasti on sidoksissa teknologian medioimaan kieleen, 
teknologian luomaan virtuaaliseen tilaan tai toimintaan (online 'tieto- 
kone, muu teknologinen väline tai ihminen, joka on yhteydessä tieto- 
verkkoon, yleensä internetiin”). Offline-tutkimusta on yleensä traditio- 
naalinen internetaikaa edeltävä kielentutkimus (offline "tietokoneen, 
muun teknologisen välineen tai ihmisen kytkeytymättömyys tieto- 
verkkoon, yleensä internetiin’). 

Humanistisilla sekä yhteiskunta- ja käyttäytymistieteellisillä aloilla 
offline-tutkimusetiikka jaetaan yleensä kahtia: ihmiseen kohdistuvan 
tutkimuksen ja tekstin tutkimuksen etiikkaan. Kun tutkimus kohdistuu 
tekstiin, normisto eroaa huomattavasti niistä säännöistä, joita noudate- 
taan ihmistutkimuksessa (engl. human subject research). Tämä kahtiajako 
ei näytä kuitenkaan toimivan suoraviivaisesti sähköisissä ympäristöis- 
sä. Teknologian välittämässä ympäristössä tutkimus kohdistuu yleensä 
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kirjoitettuun kieleen. Kohdistuuko esimerkiksi blogin kommenttien 
tutkimus tekstiin vai ihmiseen? Eri tutkijat näyttävät olevan tästä eri 
mieltä, minkä vuoksi he soveltavat erilaisia eettisiä koodeja. Kuitenkaan 
samaan ihmiseen, samaan tekstiin tai samaan ilmiöön ei voi soveltaa 
kahta eri normistoa sen mukaan, mikä on tutkijan oma taustateoria ja 
käsitys. Ihmisen oikeudet eivät voi olla ”katsojan silmässä”, vaan niiden 
tulee olla ihmisen pysyvä ominaisuus. Tällä hetkellä digitaalisten ilmiöi- 
den olemuksesta käydään vilkasta filosofista keskustelua. Esimerkiksi 
historian alan yhdistykset ovat esittäneet, että kaikkia sähköisissä ympä- 
ristöissä esiintyviä ilmiöitä käsiteltäisiin teksteinä. Tämä mahdollistaisi 
sen, että tutkijan ei tarvitsisi erikseen selvittää, onko ihminen vai kone 
automaattisesti tuottanut tekstiä (esim. urheiluotteluiden tulosraportit). 
Täysin vastakkaisiakin käsityksiä on esitetty: kaikki sähköisesti välitetty 
kieli kohdistuu viime kädessä ihmiseen. 

On huomattu, että on olemassa suuri tarve määrittää yhdet yhteiset 
pelisäännöt, joilla toimia sähköisissä ympäristöissä. Sääntöjen tulisi olla 
sellaiset, että myös liikeyrityksissä tehtävä tutkimus (nk. sale, ks. Johdan- 
non luku 2.2. tk.) olisi akateemisen tutkimuksen kanssa samalla linjalla. 
Fi ole erityisiä moraalisia syitä, joiden vuoksi osakkeenomistajien tai 
harvojen yksityistä etua ajavien tutkimusta ei voisi rajoittaa sama tiukka 
säännöstö, joka rajoittaa myös akateemista tutkimusta." 

Teknologian nopea kehitys, teknologian välittämä diversiteetti, jossa 
kieli esiintyy, ja myös tutkijoiden käyttämät useat erilaiset sähköiset työ- 
kalut ovat saaneet monet päättelemään, että yleiset makroeettiset, ylhääl- 
tä alas kategorisesti sovellettavat koodit eivät enää sovellu tutkimuksiin 
(ks. esim. de Costa 2015). Uudet teknologiat ovat saaneet aikaan mi- 
kroeettisten? lähestymistapojen yleistymisen: tutkimuksen kuluessa vas- 
tataan eettisiin kysymyksiin, ja tutkimusasetelma sekä tutkimuseettiset 
päätelmät ovat monesti ainutlaatuisia, tapauskohtaisia ja yksilöllisiä. 

Eräät ihmistieteiden filosofit, kuten Hans-Georg Gadamer (1976), 
Michel Foucault (1982) ja nykyaikaisen feministisen tiedekritiikin edus- 
tajat, ovat sitä mieltä, että arvovapaata tiedettä ei ole olemassa. Etenkin 
Julia Kristeva (1988) ja Luce Irigaray (2017) ovat kritisoineet objektii- 
visena ja neutraalina esiintyvää tieteen kieltä, joka kuitenkin kaiken 
muun inhimillisen toiminnan tavoin perustuu valintoihin, intresseihin 
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ja pyrkimyksiin. Mikroeettinen trendi, joka pakottaa tutkijan pohtimaan 
omia arvovalintojaan tutkimuksessa, on tuonut siten muutoksen tähän 
jännitteeseen. Moraalifilosofinen pohdinta osana tutkimusta ja arvoihin 
perustuva argumentaatio ovat tulleet jäädäkseen. Hyvään tutkimukseen 
kuuluu nykyään monipuolinen arvojen, eettisten toimintakoodien, joh- 
tamistapojen ja lähtöoletusten kyseenalaistaminen. Eettinen pohdinta 
kyseenalaistaa tutkijan omankin aseman, intressit ja ennakkokäsitykset. 
Tutkimusjulkaisuihin integroitu moraalifilosofinen pohdinta tuo siten 
suuremmassa määrin esille tutkijan subjektiivisuutta ja erehtyvyyttä. 
Fettinen positio on välttämättä avoin muiden inhimillisille kokemuksil- 
le, tulkinnoille ja näkemyksille. Kielentutkimuksen soveltaminen digi- 
taalisessa ympäristössä tuo siten mukanaan muutoksia, ei vain tieteen 
etiikkaan vaan myös tieteelliseen argumentaatioon. 


4.2. Etiikan lajit ja tutkimus 


Käsite etiikka viittaa niihin toimintakoodeihin, jotka on johdettu ar- 
voista. Etiikan eli moraalifilosofian tutkimusaluetta ovat siten arvot ja 
se tapa, jolla arvoista johdetaan oikeaa toimintaa ohjaavia sääntöjä tai 
normeja. Hyvää (tai oikeaa) on sellainen, joka lisää tai säilyttää itseis- 
arvoa, ja pahaa (tai väärää) vuorostaan sellainen, joka tuhoaa tai vähen- 
tää itseisarvoa. 

Itseisarvot ovat päämääriä. Yleensä esimerkiksi ihmiselämää pidetään 
sellaisena itseisarvona, jota ei voi perustella muilla tekijöillä ja jota kan- 
nattaa tavoitella sen itsensä vuoksi. Välinearvoilla on arvoa, koska niiden 
avulla saavutetaan itseisarvoja. Näin esimerkiksi tutkimusetiikalla voisi 
ajatella olevan välinearvoa, koska sillä tutkimuksen kuluessa turvataan 
ihmisten hyvinvointi. 

Toimintakoodien johtamisen tavat voi karkeasti jakaa kolmeen: 
seurausetiikkaan, velvollisuusetiikkaan ja hyve-etiikkaan. Seurausetiikka 
määrittää teon moraalisen arvon sen mukaan, missä määrin teon seu- 
raus palvelee itseisarvoja. Seurausetiikan tunnetuin muoto on utilitaris- 
mi eli hyötyetiikka. Sen mukaan eettisen toiminnan johtava periaate on, 
että aina on tehtävä se teko, josta on kaikkien ihmisten kannalta suurin 
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mahdollinen hyöty. Tämä tarkoittaa, että jokin normaalisti eettisesti 
tuomittava teko voi jossain tilanteessa olla moraalinen. Jos esimerkiksi 
kielentutkija rikkomalla yhtä pienempää sääntöä, esimerkiksi vaitiolo- 
velvollisuutta, turvaisi koko kieliyhteisön etniseltä puhdistukselta, olisi 
se utilitaristisen periaatteen mukaan hyväksyttävä pieni paha, jotta saa- 
vutettaisiin laajempi hyvä. 

Velvollisuusetiikassa johdetaan arvosta kategorinen sääntö. Siksi 
jotkin teot ovat aina kiellettyjä tai velvoittavia riippumatta kontekstis- 
ta. Velvollisuusetiikassa voidaan tehdä sääntöluettelo tai yksi yleinen 
sääntö. Sääntöluettelossa jokaisesta erillisestä arvosta johdetaan koodi. 
Jos esimerkiksi totuus käsitetään itseisarvoksi, on vastattava totuuden- 
mukaisesti silloinkin, kun tietää vastauksen johtavan omaan tai toisen 
tuhoon. Juuri totuudenmukaisuuden katsotaan kuuluvan tutkijan vel- 
vollisuuksiin — tutkijan ei katsota koskaan voivan antautua vilppiin, val- 
heeseen tai vääristelyyn. 

Yleensä tutkimuseettisissä koodistoissa ja kansallisvaltioiden laki- 
normistoissa on määritelty arvohierarkioita: esimerkiksi ihmiselämä 
menee kategorisen totuuksien julistamisen edelle. Jos tutkija esi- 
merkiksi tekee töitä etnisen puhdistuksen kohteena olevan vähemmis- 
tön kanssa, hänen tulee harkita erityisen huolella, mitä tosiasioita hän 
voi tästä ryhmästä julkaista. Tutkittavien henkilötiedoista vaikenemista 
edellytetään suurimmassa osassa tutkimustyyppejä. 

Velvollisuusetiikka voi perustua myös yhteen ainoaan periaatteeseen, 
josta muut toimintanormit johdetaan. Tunnetuin tällaisista velvollisuus- 
eettisistä normeista on Kantin kategorinen imperatiivi. Se kehottaa 
miettimään, onko teko, jonka on päättänyt tehdä, moraalisesti niin 
hyvä, että siitä voi tehdä maksiimin eli toivoa sen olevan yleispätevä, 
kaikkia yhtäläisesti koskeva laki. Useat kenttätutkimusoppaat kehotta- 
vatkin pohtimaan uusia tilanteita, joihin ei ole olemassa ennalta eettistä 
koodia kantilaisittain: ”toivoisinko, että esimerkiksi tästä käyttämästäni 
tavasta tulisi sellainen yleinen laki, joka koskisi myös itseäni ja lapsia- 
ni”. Kategorista imperatiivia kutsutaan myös kultaiseksi säännöksi, sil- 
lä sen katsotaan ohjaavan ihmisen moraalifilosofista päättelyä oikeaan 
suuntaan hankalissakin kulttuurisidonnaisissa tutkimustilanteissa. 
Esimerkiksi Karen Rice (2004) ehdottaa, että tutkija voi käsitteellistää 
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minkä tahansa aspektin tutkimusmetodistaan kysymyksenä, miten siinä 
suhtaudutaan tutkimukseen osallistuviin ihmisiin, ja samalla pohtia, 
tahtoisiko itseään kohdeltavan näin. 

Ihminen hahmottuu osaksi tutkimusta ainakin seuraavilla tavoilla: 


tutkimuksen tekeminen ihmisillä (on humans) 
tutkimuksen tekeminen ihmisten kanssa (with humans) 


— ihmiset tutkimuksen välineinä (humans as means to data or results) 
— tutkimuksen tekeminen ihmisille (for humans). 


Ihmisen käyttö välineenä ei ole yleisesti hyväksyttävää, joten kielen- 
tutkimusta ohjaavana periaatteena tulisi olla, että tutkimusta tehdään 
ihmisille ja ihmisten kanssa. Tutkimuksen eettinen asennoituminen 
yhteisöön ja sen jäseniin näkyy Ricen (2004) mukaan tutkimuksen ku- 
luessa tehdyissä metodologisissa ratkaisuissa. 

Hyve-etiikan näkökulma on hyvin toinen kuin seuraus- ja velvollisuus- 
etiikan. Se keskittyy toimijan omiin ominaisuuksiin, tunteisiin ja moti- 
vaatioihin. Hyve-etiikka korostaa ihmisen sisäisen motivaation merkitys- 
tä ja toimijan omaa käsitystä hyvästä ja pahasta. Hyve-etiikka hahmottaa 
eettiset valinnat ihmisyyden osana, kunkin ihmisen luonteenpiirteenä, 
joka toisaalta selittää tämän ihmisen käytöstä (antelias ihminen antaa 
omastaan) ja toisaalta on ihmisen omassa kehityksessä tavoittelemi- 
sen arvoinen piirre (ihminen haluaa olla vähemmän itsekäs). Hyve- 
etiikka pyrkii määrittämään ne ominaisuudet, joita hyveellisellä ih- 
misellä on. Ammattietiikka on usein eräänlaista hyve-etiikkaa. Hyvää 
tutkijaa luonnehditaan usein sanoilla tarkka, rehellinen, lahjomaton ja 
utelias. Nykypäivän uusliberaalissa hengessä tutkijalta vaaditaan myös 
kommunikaatiotaitoja, ryhmähenkeä ja tuloksellisuutta (Niiniluoto & 
Sihvola 2005). 

Tutkimuseettiset normistot ovat yleensä yhdistelmiä edellä kuvatuis- 
ta kolmesta tavasta johtaa eettisiä toimintakoodeja. Kansallisvaltioiden 
lainsäätäjät ja oikeuslaitokset, tutkimusalojen yhdistykset (esim. BAAL 
2006) ja tiedelehdet (esim. TESOL Quarterly) kehittävät tutkimuseettisiä 
normistoja. Toisinaan myös tiettyihin erityisryhmiin (esim. lapset), kieli- 
ryhmiin (vähemmistökieliryhmät) tai kieliin (uhanalaiset kielet) liittyy 
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omia normistoja. Esimerkiksi yhdistys Applied Linguistics Association 
of Australia on julkaissut vuonna 1998 ohjeiston (ALAA 1998), jossa 
määritellään, miten aboriginaalien oikeudet turvataan tutkimuksen 
kuluessa. Samankaltaisen ohjeiston, jossa suojataan vähemmistöjä, on 
julkaissut myös yhdistys American Association for Applied Linguistics 
(AAAL 2011) vuonna 2011. Ero näiden kahden ohjeiston välillä on, että 
toinen perustuu etnisyyteen ja toinen kielelliseen kriteeriin: AAAL 
suojaa kaikki korostuksella (engl. accented speech) englantia puhuvat 
vähemmistöryhmät. 

Suomessa Tutkimuseettinen neuvottelukunta? ohjaa tutkimuseettistä 
keskustelua ja on julkaissut oppaita (esim. Hyvä tieteellinen käytäntö 


2012) sekä verkkosivun vastuullinentiede.fi. Vastuullinen tiede -sivusto 
opastaa yleistajuisesti tutkimusetiikan hyviin käytänteisiin, ja se sisältää 


tietoa myös tiedeviestinnän ja avoimen tieteen periaatteista. 

Tutkimuseettisten normistojen välillä on toisinaan ristiriitoja, joten 
tutkijan kannattaa tutustua perinpohjaisesti oman alansa eksplisiittisesti 
kirjoitettuihin normistoihin ja erilaisiin käsityksiin hyvästä tutkimukses- 
ta. Tutkimusetiikassa tapahtuu myös nopeita muutoksia uusien meto- 
dien ja teknologioiden kehittyessä. Esimerkiksi vuonna 2018 voimaan 
tullut uusi EU:n tietosuoja-asetus asettaa joitakin uusia rajoituksia ta- 
voille kerätä tietoa sähköisissä ympäristöissä. Jos omalla alalla huomaa 
ristiriitoja eri normistojen välillä tai jotkin normit vaikuttavat liian levä- 
peräisiltä tai aivan liian ankarilta, nämä erilaiset huomiot tulee tuoda 
esille tutkimusjulkaisussa ja keskusteluttaa oman alan tiedeyhteisössä. 
Eettinen normisto on eettinen vain sikäli, kuin se tosiasiassa suojaa 
tutkimukseen osallistuneiden henkilöiden oikeuksia. Tutkimusetiikka 
pelkkänä hyveen viestittämisen (engl. virtue signaling) välineenä on eräs 
korruption muoto (Orlitzky 2017). 


4.3. Laajan vastuun etiikka 
Nimensä mukaisesti laajan vastuun etiikka pohtii tutkimuksen laajem- 
pia yhteiskunnallisia, historiallisia ja ekologisia vaikutuksia. Mitä seu- 


rauksia tutkimuksen tuloksilla voi olla? Voiko tutkimuksen tuloksilla 
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saada tahattomasti aikaan vahinkoa, harmia tai haittaa yksildille tai yh- 
teisdille? Onko tutkimuksella globaaleja vaikutuksia? Ottaako se tulevien 
sukupolvien oikeudet huomioon? Tulisiko tutkimusta tehdä lainkaan? 
Koska tutkijanetiikka kieltää vääristelemästä tutkimustuloksia, ainoa 
vaihtoehto on jättää tekemättä tai julkaisematta sellainen tutkimus, joka 
saattaisi aiheuttaa vahinkoa. 

Entä kuinka vakava potentiaalisen vahingon tulee olla, jotta tutkijal- 
la on velvollisuus jättää tutkimus julkaisematta? Mitä eroa on atomi- 
pommilla ja kieliryhmän syrjimisellä? Tässä yhteydessä on mielekäs- 
tä tuoda esiin, miten pohdinta tutkijan laajasta vastuusta alkoi. Niin 
kutsuttu Manhattan-projekti sysäsi liikkeelle tapahtumaketjun, joka 
sai alkunsa, kun natseja paennut unkarilainen fyysikko Leo Szilard sai 
Albert Finsteinin vakuuttuneeksi siitä, että Otto Hahnin saamia tulok- 
sia atomin halkaisemisesta voisi soveltaa sodankäynnissä. He kirjoitti- 
vat yhdessä presidentti Rooseveltille kirjeen, jossa vakuuttivat tämän 
atomipommia koskevan tutkimuksen tarpeellisuudesta. Oli kehitettävä 
atomipommi ennen natsi-Saksaa. 

Kysymys tutkijoiden laajasta vastuusta nousi, kun suuri yleisö ha- 
lusi selvittää, mikä oli tutkijoiden moraalinen vastuu, kun Yhdysvallat 
lopulta pudotti atomipommit vuonna 1945 sodassa Japania vastaan 
sellaisessa tilanteessa, jossa Saksa ei enää ollut sotilaallinen uhka. Oli 
myös jo käynyt ilmi, ettei Saksalla edes ollut atomipommia. Manhattan- 
tutkimusprojekti johti satojen tuhansien siviilihenkilöiden kuolemaan. 
Olivatko tutkijat ja atomipommin kehittäjät siis moraalisessa vastuussa 
tapahtuneesta? Kysymys tutkijoiden yleisestä moraalisesta vastuusta ase- 
tettiin tämän jälkeen uudelleen. 

Julkisuudessa Manhattan-projektin tutkijat esittivät, etteivät he tien- 
neet, että pommilla voisi olla tuhoisia vaikutuksia. He siis vähättelivät 
moraalista vastuutaan vetoamalla tiedolliseen argumenttiin. Moraali- 
filosofiassa on vaikeampaa perustella vastuuta, jos tekijällä ei ole ol- 
lenkaan tietoa tekonsa todellisesta luonteesta ja sen seurauksista. On 
kuitenkin epäuskottavaa, että tutkijat eivät ymmärtäisi, että pommilla 
voi pommittaa. Kävikin ilmi, että atomipommin vaikutuksia testattiin 
Yhdysvalloissa etukäteen, myös ihmisillä (Roelcke & Maio 2004). Esi- 
merkiksi Vanderbiltin yliopistossa 800:lle raskaana olevalle naiselle 
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annettiin radioaktiivista rautaa, jotta saatiin selville radioaktiivisuuden 
vaikutus sikiöön (Eaton & Kennedy 2007, 39). Tutkijat siis tiesivät 
atomipommin seurauksista ihmisille ja osallistuessaan tutkimukseen 
myös hyväksyivät sen, että tutkimuksen kuluessa vahingoitettiin oman 
maan kansalaisia, naisia ja lapsia. 

Vaikka nykypäivänä tällaiset toisen maailmansodan aikaiset tapahtu- 
mat tuntuvat ehkä kaukaisilta ja niiden pohtiminen voi vaikuttaa tarpeet- 
tomalta, liittyy tapahtumien taustalla oleviin kysymyksenasetteluihin ja 
oletuksiin ajankohtainen piirre, jota on syytä pohtia myös kielitieteessä. 
Kuten tuolloin niin myös nyt juuri uudet teknologiat luovat sellaisia 
uusia mahdollisuuksia ja toimintoja, joiden yhteydessä vanhat oletuk- 
set moraalista ja moraalisesta toiminnasta on tarkistettava. Juuri van- 
hat yleisesti hyväksytyt moraaliset näkökannat nimittäin mahdollistivat 
laajamittaisen tuhon jättäessään katveeseen suoraan totuttuihin peri- 
aatteisiin sopimattomat uudet ilmiöt. Manhattan-projektin mahdollinen 
vastine kielitieteessä voisi olla vaikkapa se, millä lailla kielentutkijat, jot- 
ka osallistuisivat esimerkiksi kielellistä profilointia suorittavan ohjelmis- 
ton tekoon, olisivat moraalisesti vastuussa sen käytöstä ja seurauksista, 
jos ohjelmistoa käytettäisiin vaikkapa vakaumukseltaan tietyn ihmis- 
ryhmän vainoamiseen ja tuhoamiseen. 

Toisena esimerkkinä voi esittää lääkärin ammattietiikan kehittymi- 
sen. Hippokrateen vala ja sitä seurannut tutkimuseettinen kirjallisuus 
(esim. Percival 1803) pitivät lääkärin oikeutta toteuttaa lääketieteellisiä 
toimenpiteitä potilaalle ensisijaisena suhteessa potilaan oikeuksiin. Jos 
lääketieteellisen toimenpiteen tekeminen vaatisi valehtelemista tai to- 
tuuden peittelyä potilaalta, lääkäri olisi suorastaan velvollinen valehte- 
lemaan. Tämä käsitys oli yleisesti niin hyväksytty, että vaikka 1920- ja 
1930-luvuilla sekä Yhdysvalloissa että Euroopassa jotkut harvat ehdot- 
tivat tutkimuseettistä normistoa ja potilaiden hyväksynnän pyytämistä 
tutkimuksiin, valtaosa tiedeyhteisöstä piti tällaista rajoittavaa koodistoa 
tarpeettomana ja jopa tieteen hengen vastaisena. Tieteellinen yhteisö 
piti siis oikeutenaan tehdä kokeita haavoittuvaisilla ryhmillä, kuten lap- 
silla, psykiatrisilla potilailla, värillisillä ja köyhillä. Manhattan-tapaus ja 
natsi-Saksan keskitysleirien epäinhimilliset kokeet olivat tämän laajasti 
hyväksytyn asenteen ääri-ilmentymiä. Vasta järkyttävien tapahtumien 
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kautta suuri yleisö tuli tietoiseksi siitä, että tarvitaan yleiseettiset nor- 
mistot, jotka takaavat, että raskaana oleva nainen voi mennä synnytys- 
sairaalaan eikä hänen tarvitse pelätä, että häneen ruiskutetaan hänen 
tietämättään myrkkyä. Hän voi myös lähettää lapsensa logopedille ja 
olla täysin varma, että siellä ei testata salaa sähköshokkien vaikutusta 
ääntämiseen. 

Vallitseva käsitys viime vuosisadalla siis oli, että tieteen tekijöillä on 
erityisiä oikeuksia pyrkiessään tietoon, mikä näkyi edellä esitetyn lisäksi 
muun muassa alkuperäiskansojen ja kielten tutkimuksessa. Antropo- 
logisessa kielitieteessä ja muussa kenttätutkimuksessa rokottamatto- 
mien alkuperäiskansojen pariin mentiin välittämättä seurauksista. 
Länsimaisten lähetyssaarnaajien ja tutkijoiden tuomat virukset ovatkin 
tuhonneet kieliyhteisöjä mittakaavassa, jota esimerkiksi Tierney (2000) 
on verrannut kansanmurhaan. 

Finstein, joka katui osallisuuttaan atomipommin kehityksessä, oli 
yksi ensimmäisistä, jotka ehdottivat tutkijan etiikan täyden vastuun mal- 
lia. Tämän mallin perusajatus on, että voi olla olemassa sellaisia asioita, 
joita ihmiskunnan ei tulisi tutkia, ja esineitä, joiden valmistusohjetta 
ihmisillä ei tulisi olla. Tieteellisellä tiedolla voi olla yhteisön näkö- 
kulmasta epätoivottavia seurauksia, tai tieteellisen tutkimuksen tulos 
voi luonteeltaan olla sellainen, että se loukkaa keskeisiä arvoja. Tallai- 
sia ovat esimerkiksi ihmisen kloonaus sekä biologiset ja autonomiset 
aseet. Kielentutkimuksessa vastaavanlaisia alueita voivat olla ihmisten 
yksityisyyteen ja autonomisuuteen kajoavat digitaaliset profilointi- ja 
manipulointiohjelmat. Täyden vastuun malli tarkoittaa, että kullakin 
tutkijalla on vastuu toimia moraalisesti, myös silloin kun vallitseva eet- 
tinen koodisto ei vielä ole virallisesti rajoittanut tieteellistä tutkimus- 
ta. Tieteessä tutkijan voidaan aina ajatella olevan uuden tiedon äärellä; 
vanhan tiedon toistaminen yksinomaan ja sellaisenaan ei ole tieteen 
tavoite. Loogisesti vanhat eettiset koodistot eivät voi sisällyttää itseensä 
sitä, mitä vielä ei tiedetä. Yksittäisen tutkijan vastuu on siten aina pohtia 
tutkimuksensa seurauksia: Finsteinin mukaan tutkija on vastuussa siitä 
tiedosta, jonka hän saattaa yhteisön ulottuville. 

Myös toisenlaisia näkemyksiä on esitetty. Esimerkiksi Wiberg (2006, 
265) esittää, että tutkijaa ei voi laittaa yksin vastuuseen muiden teoista, 
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vaikka ne perustuisivatkin hänen tutkimuksensa tuloksille. Tämän nä- 
kemyksen mukaan tutkija ei kanna muiden toimijoiden moraalista 
taakkaa yksinkertaisesti siksi, ettei hänellä ole valtaa määrätä heidän 
tekojaan. Tiedon jakaminen ei implikoi vastuuta sen käytöstä. 

Graham (1978), joka on paljon pohtinut laajaa etiikkaa, on kuitenkin 
eri mieltä ja esittää, että tutkija on aina moraalisesti vastuussa tutkimuk- 
sensa seurauksista. Hän antaa esimerkin: Natsi-Saksan vallan aikana tut- 
kija löytää perinnöllisen Tay-Sachsin taudin juutalaisten perimästä. Koska 
natsi-Saksan poliittisessa kontekstissa tiedon julkaisemisen seuraukset 
voidaan arvioida ja tutkija siten voi tehdä moraalisen valinnan, on hän 
myös vastuussa siitä, että hänen tutkimustaan käytettäisiin vähemmistön 
etnisessä puhdistuksessa (ks. myös Lötjönen 1999; Konstenius 2014). 

Wiberg ja Graham ehkä puhuvat eri mittakaavoissa, ja siksi päätel- 
mät eroavat. Laajan vastuun etiikan keskustelussa on mielekästä pohtia, 
olisiko oma tutkimus vahingon väline, välittäjä tai sen aiheuttaja. Tu- 
hon ja vahingon välineitä voivat olla autot, tietokoneet ja muut erilaiset 
arkiesineet, joita ilman emme ehkä voisi nyky-yhteiskunnassa toimia. 
Autonomiset aseet tai vainottujen ryhmien automaattiseen kielen tun- 
nistamiseen kehitetyt välineet taas ovat välittömiä vahingon aiheuttajia: 
niiden sovellusalue on vahingon aiheuttaminen. 

Kielitieteessä ja antropologiassa Grahamin esimerkkiä on usein käy- 
tetty havainnollistamaan yhteiskunnallisen tiedostamisen merkitystä. 
Julkaistua tietoa voi mahdollisesti käyttää haavoittuvaista ryhmää vas- 
taan. Esimerkiksi Dorian (1993) painottaa, että tutkimus tehdään aina 
tietyssä historiallisessa ja poliittisessa kontekstissa, jota kielentutkijan 
tulee pohtia kieliyhteisön etujen näkökulmasta. Myös Linguistic Society 
of America -yhdistyksen; virallisten ohjeiden mukaan kielentutkijan tulee 
arvioida tutkimuksensa mahdollisia sosiaalisia ja poliittisia seurauksia. 

Pietarisen ja Launiksen (2002) mukaan tutkijan on kehitettävä en- 
nakoivaa näkemystietoa siitä, miten hänen tutkimuksensa tulokset 
voivat vaikuttaa. Vaikka tulevaisuus on arvaamaton eikä tutkija voi sitä 
kontrolloida, tutkija ei vapaudu eettisestä vastuusta silloin, kun hän itse 
uskoo, että tutkimustuloksia voidaan käyttää keskeisiä ihmisarvoja louk- 
kaavalla tavalla. Pietarisen näkemyksen mukaan tutkijan velvollisuuk- 
siin kuuluu kehittää näkemystietoa oman tutkimuksensa mahdollisista 
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vaikutuksista. Näkemystiedon kehittäminen kuuluu siis hänen mieles- 
tään tutkijan ammattitaitoon ja ammattietiikkaan. 

Näkemystiedon kartuttamiseksi tutkimus tulisi aloittaa eettisillä 
kysymyksillä. Creswellin ja Creswellin (2017) mukaan tutkijan tulee 
pohtia esimerkiksi sitä, mikä tutkimuksen tarkoitus on. Jos tutkija ei 
keksi mitään funktiota tutkimukselleen ja näkee sen turhana, silloin se 
on yhteiskunnallisten varojen haaskausta ja hänen tulisi harkita jota- 
kin muuta tutkimuskysymystä. Jos taas tutkimuksella on ainakin yksi 
merkittävä anti, silloin sillä on myös seurauksia. Tätä seurausta ja sen 
yhteiskunnallisia sidoksia tutkijan on pohdittava eri näkökulmista. Täl- 
lainen tutkimuseettinen pohdiskelu koskee niin perus- kuin soveltavaa- 
kin tutkimusta. 

Wolfram (1993, 227) on muotoillut ”kielitieteellisen kiitollisuus- 
periaatteen”. Sen mukaan on mukaan kielentutkija on aina kiitolli- 
suudenvelassa sille yhteisölle, jolta on kerännyt datan, ja on näin ollen 
velvollinen myös toimimaan yhteisön parhaaksi (ks. Lingvistinen etno- 
grafia toimintayhteisöissä; Kielten dokumentointi ja kieliopin kuvaus; 


Antropologinen lingvistiikka tk.). Siksi kielentutkimuksessa tulisi hä- 
nen mukaansa aluksi pohtia tutkimusongelmaa ja tutkimusasetelmaa 
tutkittavan kieliryhmän etujen perspektiivistä. Onko tutkimukseen va- 
littu käsitteistö tutkittavan yhteisön identiteetin ja etujen mukainen? 
Millaisessa sosiopoliittisessa kontekstissa tutkimusta tehdään? Voiko 
tutkimuksen julkaisemisesta koitua haittaa ryhmälle? Miten siitä koi- 
tuisi etua? Wolframin (mt.) näkemys tutkijan eettisistä velvollisuuksista 
on siten Pietarisen ja Launiksen (2002) käsityksiä vaativampi: tutkijan 
ei ainoastaan tule varoa tekemästä haittaa, vaan hänen tulee tutkimuk- 
sellaan pyrkiä saamaan aikaan hyviä asioita kieliyhteisölle. 

Joskus tutkimuksen päämäärä itse asiassa on vahingoittaa tai hei- 
kentää tutkittavaa ilmiötä. Rikollisuutta, korruptiota, ihmiskauppaa tai 
köyhyyttä tutkivan on yleensä moraalista asettaa kysymyksensä siitä 
näkökulmasta, miten ilmiötä vähennetään, eikä suinkaan siitä, miten 
sitä lisättäisiin. Kielitieteessä tällaisia päämäärähakuisia tutkimusalueita 
ovat esimerkiksi seksistinen kieli, propaganda tai vähemmistön ihmis- 
arvoa alentava terminologia. Vahingoittamisen kieltävän imperatiivin 
seuraaminen sokeasti olisi epäeettistä tässä kontekstissa. Laajan vastuun 
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eettisten kysymysten luonteeseen kuuluukin, että laajan vastuun pohdin- 
taa ei voi mekaanisesti soveltaa ja kopioida muista tutkimuksista. Uusi 
tutkimus on usein ainutlaatuinen, ja sillä on muuttuvassa maailmassa 
uusia suhteita, joita ei aikaisemmissa tutkimuksissa ole ollut (Graham 
1981; Löppönen 1991; Wiberg 2006; Pietarinen & Launis 2002). Laajan 
vastuun etiikka edellyttää yhteiskunnallista — ja nykyään myös globaalia ja 
teknologista — valveutuneisuutta. Uudet teknologiat mahdollistavat uusia 
tapoja vahingoittaa tai edistää erilaisten kieliyhteisöjen hyvinvointia. 


4.4. Tutkimusetiikka 


Toisen maailmansodan jälkeen tieteellisessä yhteisössä syntyi yksi- 
mielisyys siitä, että tieteellistä tietoa ei ole oikeutta hankkia millä 
hinnalla hyvänsä. Ihmisarvojen ja eettisten normien on ohjattava 
tutkimusasetelmien suunnittelua ja rajoitettava vahinkoa aiheuttavien 
tekniikoiden käyttöä. Natsi-Saksassa tehdyt ihmisyyttä vastaan rikkovat 
lääketieteelliset kokeet olivat nousseet Nürnbergin oikeudenkäynnin 
kautta yleiseen tietoisuuteen. Myös YK:n yleismaailmalliset ihmis- 
oikeudet kirjoitettiin, jotta historia ei toistaisi itseään. YK:n yleinen ja 
universaali ihmisoikeusjulistus määrää kaikille ihmisille yhtäläiset oi- 
keudet; artiklassa 7 säädetään erityisesti ihmisen oikeudesta itse päättää 
siitä, osallistuuko hän tieteelliseen tutkimukseen Yleiset luonnolliset ja 
luovuttamattomat ihmisarvot ja ihmisen oman tahdon kunnioitus ohjaa- 
vat siis nykyään tutkimusetiikkaa. Yleinen periaate on se, että ihmisen 
tulee antaa tietoon perustuva suostumuksensa tutkimukseen. Suostu- 
muksen ja tiedon tulisi ideaalisti kattaa kaikki tutkimuksen kuluessa 
tehdyt toimenpiteet ja prosessit, joita ovat muun muassa aineistojen 
kerääminen, käsittely, säilytys ja julkaiseminen. Tutkija voi huomata 
tässä — kuten joskus muuallakin tutkimuksessaan — normiristiriidan. 
Toisaalta alalla ehkä kehotetaan säilyttämään aineistot jatkotutkimus- 
käyttöön, mutta samalla halutaan lisätä tutkimukseen osallistuneiden 
henkilöiden oikeutta hallita omia tietojaan. 

Suhteessa moneen muuhun ihmistieteen alaan kielitiede on ollut var- 
sin turvallista osallistujille, ja tieteenala on säästynyt alaa ravisuttavilta 
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skandaaleilta. Inmisarvon kunnioittamisen normi on kuitenkin johtanut 
myös kielentutkimuksessa arvioimaan esimerkiksi termejä, joilla kenttä- 
tutkimuksessa nimitetään tutkimukseen osallistuneita. Vaux ja Cooper 
(1999) sekä Munro (1998; 2000) toteavat, että esimerkiksi termillä 
informant (suom. informantti) voi olla englannin kielessä ikävä kon- 
notaatio, sillä termiä käytetään myös poliisin informantista ja vakoilu- 
informantista. Tämä käyttöyhteys voi luoda vaikutelman ihmisestä, 
joka salaa, epäeettisesti tai vastoin kieliyhteisönsä tahtoa antaa tutkijalle 
informaatiota kieliyhteisön kielitiedosta. Toisaalta termi on yleisessä 
käytössä muun muassa sosiolingvistiikassa, eikä siihen ainakaan suo- 
malaisessa kontekstissa liity väärinymmärryksen vaaraa. Tutkimukseen 
osallistuvista kielen puhujista on lisäksi käytetty mm. nimityksiä kielen- 
opas ja kielimestari. 

Toinen kielentutkimuksessa esillä ollut teema on tutkimukseen osal- 
listuneiden ihmisten oikeus saada tunnustusta työstään ja tieteellisestä 
panostuksestaan. Vaux (2003) esittää, että kenttätutkimuksessa omasta 
tahdostaan ja omalla ajallaan toiminut henkilö voi kokea loukkaavana ja 
väheksyvänä sen, jos tutkija ei mainitsisikaan oleellista työtoveriaan lo- 
pullisessa julkaisussa. Vaikka tieteellinen raportti on useimmiten yksin 
kielentutkijan kirjoittama, on itse tutkimusprosessi ja aineisto yhteis- 
työn tulos. Kenttätutkimuksessa kielenoppaan rooli on siinä määrin ak- 
tiivinen, aikaa vievä ja tutkimusta ohjaava, että Vauxin (2003) mukaan 
voidaan toisinaan puhua jopa kanssatutkijan roolista. Kielenopas voi 
toimia jopa vuosikausia kielentutkijan rinnalla tai opettajana. Kanssa- 
tutkijaa olisi alentavaa kohdella nimettömänä lopullisessa julkaisus- 
sa. Tämä Vauxin esittämä ajatus on kuitenkin normiristiriidassa sen 
tutkimuseettisen normin kanssa, joka esittää, että tunnistetietoja ei tule 
kerätä, säilyttää tai julkistaa tarpeettomasti. Tunnisteellisten aineisto- 
jen käsittelystä säädetään Suomessa henkilötietolaissa (523/1999). Lain 
3. $n mukaan henkilötiedolla tarkoitetaan "kaikenlaisia luonnollista 
henkilöä taikka hänen ominaisuuksiaan tai elinolosuhteitaan kuvaavia 
merkintöjä, jotka voidaan tunnistaa häntä tai hänen perhettään tai hä- 
nen kanssaan yhteisessä taloudessa eläviä koskeviksi”. TENKin (2009)$ 
mukaan perusperiaate tunnistetietojen keräämiselle ja säilyttämiselle on 
niiden tarpeellisuus tutkimuksessa. 
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Tunnustuksen antaminen kielenoppaan työlle sekä toisaalta henkilö- 
tietojen suojelu vaatii tasapainottelua. Joskus tieteessä tällaisessa on epä- 
onnistuttu totaalisesti. Esimerkiksi niin sanottu Genie-tapaus osoitti, että 
tutkimuksen kuluessa on otettava huomioon tutkimukseen osallistuvien 
luonnolliset perustarpeet ja lasten erityinen asema. Genie on pseudo- 
nyymi kielettömälle tytölle, joka löydettiin vuonna 1970 Kaliforniasta. 
Tyttö oli ollut 20 kuukauden ikäisestä isänsä lukitsemana kellarissa. 
Päivisin lapsi oli sidottu pottaan ja öisin eräänlaiseen makuupussiin. 
Lapsi oli kasvanut 13 vuoden ikään ilman sosiaalisia kontakteja ja kuu- 
lematta puhetta. Lapsen löydyttyä myös tutkijat kiinnostuivat hänestä, 
ja häntä tutkittiin useissa eri hankkeissa (esim. Curtiss 1977). Rymer 
(1992) ja Jones (1995) pitävät Genie-tapausta esimerkkinä häikäilemät- 
tömästä tieteellisestä hyväksikäytöstä. Rahoituskauden aikana useat eri 
tutkijat altistivat tytön ankaraan testaukseen, seurantatutkimuksiin ja 
fyysisiin mittauksiin. Rahoituksen päätyttyä tutkijat hylkäsivät lapsen 
kasvattikotikierteeseen. 

Frityisryhmiä, kuten lapsia, sairaita ja vähemmistöjä, koskevat niin 
muissa tieteissä kuin kielitieteessä nykyään omat tiukat tutkimus- 
norminsa, joiden päämääränä on muun muassa estää herkässä kasvu- 
iässä olevien vahingoittaminen. Suomessa painava puheenvuoro las- 
ten ja nuorten tutkimuksen etiikassa on Lagströmin, Pösön, Rutasen 
ja Vehkalahden (2015) toimittama artikkelikokoelma. Tutkimuseettisiä 
normistoja, joiden tavoite on kattaa erityistilanteet ja erityisryhmät, on 
kehitetty etenkin viimeisten vuosikymmenien aikana. 

Kielitieteessä ylhäältä alas sovellettavia makroeettisiä normistoja 
tuotetaan nykyään kiihtyvällä vauhdilla yhdistyksissä, tiedelehdissä ja 
yliopistoissa. Moni näkee tässä myös huolestuttavan sääntöjentehtailu- 
trendin. Pirttilän (2008, 85) mukaan eettiset toimikunnat ovat muuttuneet 
neuvoa antavista elimistä tutkimusta määrääviksi normittaviksi elimiksi, 
joiden ote ajan myötä vain tiukkenee. Mäkelän (2005; 2007) mukaan sää- 
dökset harvoin parantavat tutkittavien tosiasiallista asemaa. Tieteellisen 
tutkimuksen toteuttamista ne sitä vastoin hankaloittavat. Metodologisten 
normien ja eettisten säädösten välille onkin Mäkelän ja Pirttilän mukaan 
muodostumassa normikonflikti: tutkimuksen laatu kärsii, kun tutkimuk- 
seen sovelletaan väkisin siihen soveltumattomia normeja ja käsitteitä. 
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Esimerkiksi Kimmel (1996, 283) raportoi fonetiikan alaan kuuluvasta 
tutkijasta, joka ei saanut eettiseltä komitealta hyväksyntää eri korkeudel- 
la olevien äänten (joista yksikään ei ollut normaalia puheääntä korkeam- 
malla eikä kuuloa vaurioittavaa) esittämiselle ihmishenkilöille. Peruste 
oli se, että tehtävä muodostaa riskin osallistujien hyvinvoinnille. Riski 
liittyi tutkimukseen osallistuvien henkilöiden mahdolliseen kyllästymi- 
seen. Foneettinen tutkimus jouduttiin toteuttamaan eläimillä. 

Linguistic Society of America -yhdistys (LSA) on varoittanut, että 
väkinäinen biolääketieteellisen tutkimuseettisen koodiston soveltami- 
nen kielitieteeseen johtaa tutkimusresurssien tuhlaukseen ja heikentää 
tutkimuksen laatua. Suomessa Hallamaa, Launis, Lötjönen ja Sorvali 
(2006) ovat huomanneet, että eettisiä normistoja on yleensä laajen- 
nettu lääketieteellisestä tutkimuksesta muihin tutkimusaloihin usein 
kuitenkaan tutkimatta empiirisesti, esiintyykö näissä muissa tutkimus- 
tyypeissä ylipäätään samankaltaisia eettisiä huolenaiheita. LSA? on lisäk- 
si toistuvasti todennut, että biolääketieteestä johdettu koehenkilörooli ja 
henkilövahinko-käsite ovat harvoin sovellettavissa kielitieteelliseen tutki- 
mukseen. Yhdistyksen mukaan kielitieteessä tutkimukseen osallistuva 
ihminen on usein luonnollisessa tutkimusympäristössä, minkä vuoksi 
positivistinen eksperimentaatio-käsitteistö ei ole sovellettavissa. Lääke- 
tieteen kokeellisen tutkimusasetelman mahdollisuus aiheuttaa vahinkoa 
ihmiselle on luonteeltaan hyvin erilainen kuin esimerkiksi lingvistisen 
kenttätutkijan mahdollisuus tuottaa vahinkoa kielenoppaalle. On mie- 
lekästä erottaa manipuloitu ja objektivoitu koehenkilö (engl. subject) 
kyselytutkimukseen osallistuvasta henkilöstä (engl. participant). Mitä 
avoimempi on kyselytekniikka, sitä suurempi itsemääräämisvara vastaa- 
jalla on (Fossey, Harvey, McDermott & Davidson 2002). Kyselyyn osal- 
listuva henkilö on siten usein tutkimuksessa subjektina, jonka ”ääni” 
tosiasiallisesti kuuluu (Konstenius 2014). 

Kielentutkijan kannattaa siis pohtia erilaisten normien mielekkyyttä 
tutkimuksessaan: Turvaavatko ne todella osallistujien oikeuksia? Hei- 
kentävätkö ne tutkimuksen laatua? Myös hyvin vakiintuneet käsitykset 
tutkimusnormeista voivat yllättäen jossakin kontekstissa osoittautua 
epärationaalisiksi ja epäeettisiksi. Tutkimusetiikka elää murrosta, ja sii- 
nä tapahtuu nyt muutoksia. 
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Viimeisen kahden vuosikymmenen aikana internet on muuttanut 
sitä, kuinka tutkimusetiikka tänään ymmärretään. Kun ennen kieli jaet- 
tiin puhuttuun ja kirjoitettuun kieleen, jota puhutaan tai kirjoitetaan 
yksityisissä tai julkisissa yhteyksissä, tänään on erityisesti otettava huo- 
mioon se, millä tavalla kieli on medioitunut. Kielen sähköinen välitys- 
tapa ja se teknologia, joka välittää kieltä, vaikuttavat oleellisesti siihen, 
miten kieltä voi tai saa tutkia. Teknologioiden kehittyminen on myös 
mahdollistanut aivan uusia tapoja tutkia kieltä. Aineistojen kerääminen, 
käsittely ja muokkaaminen digitaalisissa ympäristöissä herättävät siksi 
uudenlaisia eettisiä huolenaiheita, joita ei aikaisempien tutkimusten 
perusteella ole voitu ennakoida. Hyvin uudenlainen keskustelu ihmi- 
sen oikeuksista ja niiden kunnioittamisesta on meneillään digitaalisissa 
tieteissä. 


4.5. Kielentutkimus digitaalisessa ympäristössä 


Jo ennen internetiä tieteellinen tutkimus siirtyi teknologiseen ympäris- 
töön. Tutkijoiden kammioissa kirjoituskoneet vaihtuivat tietokoneisiin, 
arkistot levykkeisiin ja metalliset avaimet salasanoihin. Tutkijan mate- 
riaaliset työkalut vaihtuivat sähköisiin miltei huomaamatta. Sähköisten 
työkalujen yleistyminen mahdollisti internetin kehittymisen, joka vuo- 
rostaan muutti lähtemättömästi ihmisten tapaa kommunikoida keske- 
nään. Se sai aikaan ajassamme merkittävän kulttuurisen murroksen. 
Yhteiskunta muuttui informaatioyhteiskunnaksi, ja uudet teknologiat 
tulivat osaksi lähes kaikkea inhimillistä toimintaa. On vaikea enää löy- 
tää tietoyhteiskunnan jäsenen elämässä aluetta, jota teknologia ei edes 
välillisesti koskettaisi. 

Tietoyhteiskunta ei perustu yhteen teknologiseen oivallukseen. 
Internetin erityispiirre on juuri se, että se ei ole yksi teknologia vaan 
alati muuttuva teknologinen myriadi. Sitä ei voi siksi suoraan verrata 
painokoneeseen tai höyryjunaan. Yhden mekanismin ymmärtäminen 
ja pohtiminen ei ratkaise uusien teknologioiden myötä esiintyviä eet- 
tisiä huolenaiheita. Uusien teknologioiden erityispiirre on se, että ne 
mahdollistavat yhä uusia teknologisia innovaatioita kiihtyvällä vauhdilla. 
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Moorin (1985) mukaan uusiin teknologioihin kuuluu, että uusia piirteitä 
ei voi ennakoida vanhojen perusteella, ja siksi vanhat lait ja normit eivät 
automaattisesti kata uusien teknologioiden herättämiä eettisiä huolen- 
aiheita, vaan ne täytyy tutkia erikseen. Buchananin (1999) mukaan 
näyttää siltä, että tässä uudessa digitaalisessa tieteellisessä ympäristössä 
staattisten ja helposti vakiinnutettavien tutkimuseettisten koodistojen 
kehittäminen on nyt epärealistista. 

Teknologioiden nopeassa kehityksessä makroeettiset normistot eli 
ylhäältä alas, kaikkiin tutkimusasetelmiin yhtäläisesti ja kategorisesti 
sovellettavat normit alkavat näyttää menneiden aikojen hankkeilta. Digi- 
taalisesta diversiteetistä on tullut uusi todellisuus, mikä tarkoittaa sitä, 
että on yhä pontevammin tiedostettava mikroetiikka. On huomioitava 
jokaisessa tutkimuksessa erikseen ja eksplisiittisesti tieteellisissä jul- 
kaisuissa, miten tutkimuksen kuluessa käytetyt teknologiat ja tekniikat 
otetaan huomioon (Kubanyiova 2008). Tutkijan on perusteltava ja yk- 
silöitävä tutkimuseettiset ratkaisut, joilla hän takaa sen, että tutkimus 
on toteutettu eettisesti. Mikroetiikka, tutkimusjulkaisuihin integroitu 
moraalifilosofinen pohdinta, näyttäisi olevan erityisesti digitaalisen tie- 
teen ominaisuus. 

Mikroetiikassa oleellista on tutkimuksen kuluessa vastata joukkoon 
tutkimuseettisiä kysymyksiä. Tutkijalla on hyvä olla kyky tulla tietoiseksi 
tutkimuseettisistä huolenaiheista ja adaptoida tutkimusasetelma eettis- 
ten päätelmiensä mukaiseksi. Ulkoapäin tulleista normeista tutkijan täy- 
tyy digitaalisessa ympäristössä siirtyä eksplisiittiseen tutkimuseettiseen 
argumentaatioon. Tutkimuksen kuluessa tutkimusasetelmaa voi joutua 
muuttamaan uusien eettisten huolenaiheiden ilmetessä. Bruckman 
(2012) ennakoi myös muuttuvaa suhdetta eettisten lautakuntien ja tut- 
kijoiden välillä: tutkijoiden on aktiivisesti ylläpidettävä eettisten lauta- 
kuntien tietoja uusista eettisistä huolenaiheista muuttuvissa sähköisissä 
ympäristöissä. Eilisen valvovasta isoveljestä on tulossa oppilas. 

Sähköisten ympäristöjen tutkimusetiikkaan liittyy useita erityis- 
kysymyksiä, vaikka oletettavasti ihmisen luonnolliset oikeudet ovatkin 
pysyneet samoina. Ihmisellä pitäisi edelleen olla oikeus valita, osallis- 
tuuko hän tutkimukseen. Hänellä on oikeus yksityisyyteen, autono- 
miaan, henkilöönsä liittyviin tietoihin, turvallisuuteen ja hyvinvointiin. 
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Oikeuksien kunnioittaminen ei kuitenkaan ole teknologiavälitteisissä 
ympäristöissä yksioikoista, sillä suuri(n) osa internetin liiketoiminta- 
malleista perustuu käyttäjien datan keräämiseen, analyysiin ja myyntiin: 
käyttäjä maksaa tietyn ”hinnan”, jonka vastikkeeksi hän saa ilmaiseksi 
käyttöönsä teknologiaa. Onko käyttäjä tällöin luopunut oikeuksistaan 
yksityisyyteen, autonomiaan ja digitaaliseen henkilöönsä? Jos on, mitä 
tutkimusetiikassa tarkalleen ottaen silloin suojellaan? Usein internetin 
käyttäjien käytöstä seurataan heidän tietämättään ja dataa kerätään ker- 
tomatta, mitä tietoja on kerätty, missä niitä säilytetään ja mihin tarkoi- 
tukseen niitä käytetään. Erään käsityksen mukaan internet onkin alusta 
alkaen ollut eräänlainen käyttäytymistieteellinen laboratorio, jossa kau- 
palliset yritykset ovat voineet vapaasti testata ihmisillä erilaisten ilmiöi- 
den vaikutuksia (Ross 2014; Hunter & Evans 2016). 

Juuri internetissä laajassa skaalassa tehdyt kokeet ja kuluttajien 
suostumus datojensa keräämiseen ja käyttöön ovat saaneet monet 
tieteenalojen yhdistykset pohtimaan tiukkoja tutkimuseettisiä norme- 
jaan. Esimerkiksi American Psychological Association (APA 2010)", 
joka on perinteisesti ollut erityisen tiukka ihmiseen kohdistuvan tutki- 
muksen normeista, on jossain määrin joustanut periaatteistaan online- 
tutkimuksissa. Esimerkiksi vuonna 2012 keskusteltiin laajasti siitä, että 
tutkijat olivat manipuloineet ihmisten tunnereaktioita Facebookissa. 
Laajamittainen tunnetutkimus oli toteutettu 600 ooo henkilöllä, ja sen 
kautta saatiin pätevää empiiristä tietoa siitä, miten tunnekokemukset 
vaikuttavat ja leviävät populaation tasolla. Tätä Massive-scale Emotional 
Contagion Through Social Networks -tutkimusta (PNAS 2014) puolus- 
tettiin APA:ssakin toisaalta sillä, että tutkimusta ei olisi voitu toteuttaa 
millään muulla tavoin, ja se oli siksi tarpeellinen. (Ross 2014.) Toisaalta 
tutkimusta puolustettiin myös sillä, että kaupalliset yritykset tekevät päi- 
vittäin tuhansia samanlaisia tutkimuksia kuluttajilla, ja akateemisillakin 
tutkijoilla tuli olla samat lähtökohdat. 

Tämä akateeminen tutkimus nosti suuren yleisön tietoisuuteen sen 
seikan, että kaupalliset yritykset todella tekevät päivittäin tuhansia eks- 
perimenttejä suurilla populaatioilla omilla verkkosivustoillaan. Akatee- 
miset tutkijat usein tekevät omia tutkimuksiaan pienemmällä skaalalla, 
julkisesti ja vähemmän manipuloiden. Tutkimusetiikassa on vastattava 
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siihen, miksi hyväksytään yksi tutkimustyyppi rahoituksen perusteella 
mutta ei toisenlaista. Niiniluoto kutsuu saleksi tutkimusta, jota tehdään 
suuren yleisön tietoisuuden ulottumattomissa omaa voiton pyyntiä ta- 
voitellen (ks. Johdannon luku 2.2. tk.). Miksi hyväksyttäisiin sale-tutki- 
mukset internetissä mutta ei tieteellisiä, julkisella rahoituksella suoritet- 


tuja ja yhteishyvään pyrkiviä tutkimuksia? 

Kaikki käy -asennetta internetissä ovat puolustaneet erityisesti liber- 
tarianistiset yhdistykset. Tämä on erityisesti Yhdysvalloissa suosittu po- 
liittinen näkökanta, jonka mukaan valtion ei tulisi rajoittaa kansalaisten 
tai yritysten pyrkimyksiä. Esimerkiksi Flectronic Frontiers Foundations 
(EFF) on lobannut internetin toimijoille "vapautta" kansallisvaltioiden 
lainsäädännöstä. Kansalaisen vapauksien nimissä — tai sijaan — puoluste- 
taankin yritysten vapautta toimia ilman valvontaa ja sääntelyä internetissä. 
Nykypäivänä juuri yritysten häikäilemätön ja epäeettinen toiminta usein 
rajoittaa yksilön vapauksia. Vaihtoehtona onkin esittää, että yritykset nou- 
dattaisivat tutkimuksissaan internetissä tieteen tutkimusetiikkaa. 

Kaikille yhteisten pelisääntöjen puuttuminen on akuutti ongelma, 
jonka ratkaisemiseen myös kielitieteellisen yhteisön tulisi osallistua. 
Kielentutkimuksella voisi ajatella olevan erityinen ääni digitaalisen tie- 
teen etiikassa. Juuri kielentutkijoilla on pätevää tietoa siitä, millä tavoin 
erilaiset kielelliset ilmiöt ovat sidoksissa ihmiseen ja tämän erilaisiin 
elämänalueisiin eli siihen, miten kieli vaikuttaa yhteiskunnassa, yhtei- 
söissä ja vuorovaikutuksessa. Kielitieteen näkökulmasta tutkimusetii- 
kassa nyt esitetty kategorinen kysymys siitä, onko sähköinen tutkimus 
tekstintutkimusta vai ihmistutkimusta, on ehkä liian suppea. Kielitie- 
teen näkemys kielen ja ihmisen suhteesta on tällaista joko-tai-kysymystä 
laajempi. 

Wolframin (1993) mukaan kielentutkijalla on vastuu kieliyhteisöä 
kohtaan myös sähköisissä ympäristöissä. Jos tutkija huomaa, että yh- 
teisöä tutkitaan tai kohdellaan epäeettisesti, tulisi hänen toimia yhtei- 
sön eduksi ja vaatia sellaista yhteiskunnallista sääntelyä, jonka avulla 
yhteisön etuja vaalitaan. Jos tutkija huomaisi esimerkiksi, että jotakin 
alkuperäiskansaa altistettaisiin rasittavalle, invasiiviselle (henkilön itse- 
määräämisoikeuteen kajoavalle) ja epäkunnioittavalle tutkimukselle, 
olisi hänen velvollisuutenaan toimia siten, että löydettäisiin sellaiset 
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yhteiset pelisäännöt, joiden mukaan kaikki tutkijat toimisivat ja jotka 
takaisivat kieliyhteisön hyvinvoinnin. Sama periaate pätee sähköisissä 
ympäristöissä. 

Wolframin (1993) periaatteen noudattaminen on paljastanut 
tutkimusetiikkaan toisinaan implisiittisesti piiloutuneen holhoavan 
asenteen: tutkijat uskovat tietävänsä, mikä on tutkittaville parasta. In- 
ternetin toimijoilla on yleensä oma ääni. Kun tutkijat ovat ehdottaneet 
omasta mielestään eettisiä toimintakoodeja sähköisiin ympäristöihin ja 
niissä toimiviin yhteisöihin, ne harvoin ovat olleet käyttäjien oman tah- 
don ja tavoitteiden mukaisia (Zimmer 2010; Zimmer & Proferes 2014). 
Holhoavaa asennetta tutkimukseen osallistuviin henkilöihin ei sitäkään 
voi pitää täysin eettisenä. 

Digitaalisuutta koskeva tiede on aiheuttanut sen, että tutkimusetiikka 
elää murrosvaihetta. Seuraavaksi esille nostetaan kolme kysymystä, 
joihin digitaalisessa mikroeettisessä tutkimuksessa yleensä vastataan: 
1) onko teknologia työkalu vai virtuaalinen tila tutkimuksessa, 2) onko 
tutkimuksella suora vai epäsuora suhde ihmisiin ja 3) mitä on tunnis- 
teellinen ja ei-tunnisteellinen data. Kysymykset eivät ole tyhjentäviä; 
teknologian kehittyessä ilmaantuu uusia kysymyksiä. Näihin kysymyk- 
siin ei myöskään ole yhtä oikeaa vastausta. Oleellista on kysymysten eet- 
tisen luonteen tiedostaminen ja niiden asemointi tutkimusta ohjaavassa 
moraalifilosofisessa päättelyssä. 


4.5.1. TEKNOLOGIA: TYÖKALU VAI VIRTUAALINEN 

TILA TUTKIMUKSESSA? 
Teknologia voidaan tutkimuksessa ymmärtää joko a) työkaluksi tai b) 
virtuaaliseksi tilaksi, ”paikaksi”. Seuraavassa tarkastellaan, millä tavoin 
nämä kaksi erilaista tapaa ymmärtää teknologia vaikuttavat eettiseen 
pohdintaan. 

Kun uusia teknologioita käytetään työkalun tavoin, silloin yleensä 
ohjelmistoja käytetään informaation hakuun ja säilytykseen sekä datan 
lajitteluun, koodaamiseen, käsittelyyn ja analysointiin. Tällöin tutkijan 
on tiedostettava teknologian etiikka. Teknologian etiikka tarkoittaa, että 
teknologian rakenteissa on ennakko-oletuksia tai olettamia ihmisestä, 
ihmisryhmistä ja näiden oikeuksista. Esimerkiksi pankkiautomaatti 
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olettaa keskipituisen ihmisen. Sen rakenteista voidaan päätellä, ottaa- 
ko se huomioon vähemmistöt, kuten lyhytkasvuiset, liikuntavammaiset 
tai sokeat. Samalla tavalla ohjelmistoissa on sisäänrakennettuja arvoja, 
jotka syrjivät tai suosivat eri väestöryhmiä. Esimerkiksi informaation 
hakuun käytetyt hakukoneet eivät ole neutraaleja. Googlen algoritmit 
suosivat sivustoja, jotka ovat helposti koneluettavia, toteuttavat Googlen 
omia layout-ohjeita ja joissa on AdWords-toiminto", mistä syystä Google 
on viimeisten vuosien aikana haastettu useasti EU-tuomioistuimeen. 
Google jättää pois kilpailijat ja verkkosivustot, jotka eivät maksa 
Googlelle hauista, tai asettaa ne tarkoituksellisesti huonoon asemaan 
(Introna & Nissenbaum 2000). 

Digitaaliseen viestintään kohdistuvan kielitieteen tutkimusetiikassa 
tutkijoiden on tultava tietoisiksi käyttämiensä työkalujen arvorakenteista 
ja pyrittävä neutralisoimaan vääristymät. Mikroeettisessä lähestymis- 
tavassa tulisi argumentoida ja eksplikoida sitä, miten teknologiaan 
sisäänrakennetut arvovääristymät on otettu tutkimuksessa huomioon. 

Kun uudet sähköiset teknologiat ymmärretään virtuaaliseksi tilak- 
si, yleensä viitataan sellaisiin teknologioihin kuin peleihin, virtuaali- 
siin maailmoihin, uutisryhmiin, blogeihin, mikroblogeihin, verkko- 
kursseihin, foorumeihin, keskusteluapplikaatioihin yms. Bruckman 
(2002; 2006; 2012) kehottaa pohtimaan käytössä olevia tilaa ja tilalli- 
suutta kuvaavia ilmauksia: mitä ne kertovat virtuaalisesta tilasta, ja mitä 
ne jättävät kertomatta? Sähköinen media vaikuttaa kommunikaation 
tapaan eri tavoin: se edellyttää reittejä ja asettaa läpipääsemättömiä sei- 
niä, ovia ja avaimia. Esimerkiksi salaisiin? Facebook-ryhmiin, joihin voi 
liittyä vain kutsusta ja jotka ovat erilaisten teknologisten suojamuurien, 
pääsyvaatimusten ja salasanojen takana, liittyy suurempi oletus yksityi- 
syydestä kuin tiloihin, joissa tällaisia eristäviä toimintoja ei ole. Suljettu 
tai salainen internetryhmä voi tuntua käyttäjistään ”koti-illalta ystävien 
kesken”, ja ryhmässä usein keskustellaan intiimisti olettaen, että sinne 
ei tunkeudu ulkopuolisia eikä siellä puhuttuja asioita levitellä muille. 

Käyttäjien kokemukset yksityisyydestä ja tosiasiallinen yksityisyys 
voivat olla ristiriidassa. Hudson ja Bruckman (2005) suorittivat laa- 
jan internetkäyttäjätutkimuksen, jossa verrattiin käyttäjäkokemuksia 
yksityisyydestä ja todellista yksityisyyttä. He tulivat siihen tulokseen, 
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että näiden välillä oli yleensä suuri ristiriita ja että käyttäjillä oli vain 
rajallinen tietoisuus siitä, millä tavoin teknologinen alusta tunkeutui 
heidän yksityisyyteensä. Suljettujenkin ryhmien käyttäjien IP-osoitteet, 
logit ja muut tunnisteelliset tiedot ovat palveluntarjoajan käytettävissä. 
Useimmat suuret yritykset analysoivat käyttäjiensä käyttäytymistä — jos- 
kus jopa sivuilla käytyjä keskusteluja. Keskustelut ja niiden sisältö on 
useissa maissa laillisesti yrityksen omaisuutta, mikäli näin on esitetty 
käyttäjäehdoissa. Käyttäjän kokema yksityisyys, käyttäjäehdoissa luovu- 
tetut oikeudet yksityisyyteen ja varsinaiset yksityisyysasetukset voivat 
siten kaikki olla keskenään erilaiset. Tila, joka käyttäjilleen ilmenee 
”koti-iltana ystävien kesken”, voikin datankäytön valossa pikemminkin 
näyttää tilalta, johon on asennettu kameroita ja äänityslaitteita ja jos- 
sa vuokranantaja tekee salaa merkintöjä vuokralaisen käyttäytymisestä 
vastaisuuden varalle. Digitaalisessa tutkimusetiikassa on usein yritetty 
suojata käyttäjien kuviteltua yksityisyyttä tai yksityisyyden kokemusta. 
Teknologian medioimien tilojen kompleksisuus tulisi kuitenkin koko- 
naisuudessaan ottaa huomioon moraalifilosofisessa päättelyssä. Kun 
suostumusta pyydetään tutkimuksen kohteilta, verkkosivun ylläpitäjäl- 
tä tai eettiseltä komitealta, on mielekästä problematisoida näitä erilaisia 
tiloja ja nostaa ne keskustelun kohteeksi. 

Sähköiset ympäristöt eroavat aikaisemmista medioista erityisesti juu- 
ri siinä, että aikapaikkaiset tekijät ovat muuttuneet ja aikapaikkaisuutta 
tilallisena kokemuksena luovat nyt yksityiset yritykset. Kommunikaatio 
tapahtuu yksityisten yritysten tiloissa, joihin yrityksillä on tekijänoikeus, 
eikä suurella yleisöllä ole mahdollisuutta tarkastella arkkitehtuurin ta- 
voin toimivia ohjelmistoja. 

Perinteiset tilailmaukset sopivat huonosti kuvaamaan uusia tekno- 
logian medioimia ympäristöjä. Samaan aikaan emme kuitenkaan vielä 
osaa tehdä moraalifilosofista päättelyä ilman niitä. Esimerkiksi yksityi- 
syys on ihmisen oikeus, joka aikaisemmissa yhteiskuntamuodoissa on 
määritetty juuri tilan kautta. Aikapaikkaisessa offline-ympäristössä ih- 
misellä on oikeus vaatia, että kukaan ei kurki hänen kotinsa ikkunoista, 
mutta julkisessa kulkuvälineessä hänen täytyy suostua olemaan myös 
toisten katseen kohde. Tilametaforien vaikeasta suhteesta digitaalisen 
tieteen moraalifilosofiaan tulee siten olla tietoinen, ja metaforia tulisi 
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problematisoida tutkimuksen kuluessa. Sähköinen ympäristö ei ole 
suoraviivaisesti aikapaikkainen tila, joten sopii kysyä, miten ja millaisin 
ohjelmistoin tila on luotu. Mitä nämä ohjelmistot ihmisen käytöksestä 
tässä tilassa välttämättä lukevat, tietävät ja tallentavat? 


4.5.2. ONKO TUTKIMUKSELLA SUORA VAI 
EPÄSUORA SUHDE IHMISIIN? 

Ihmistä tai ihmisen toimintaa koskeva tutkimus voi olla eri astein 
kajoavaa eli invasiivista. Tällä tarkoitetaan sitä, että tutkimustoiminta 
saattaa tarkoituksellisesti tai tahattomasti tunkeutua ihmiseen, ihmisen 
elinpiiriin tai ihmisen harjoittamaan toimintaan. Käsitettä invasiivinen 
on tyypillisesti käytetty lääke- ja hoitotieteissä, mutta se soveltuu myös 
ihmistieteisiin ja humanistiseen tutkimukseen. Seuraavaksi tarkastel- 
laan sitä, mikä on kielentutkimuksen vaikutus kielianeiston tuottanei- 
siin ihmisiin ja ihmisryhmiin erityisesti verkkoympäristössä. 

Läsnäoleva verkkotutkimus (engl. engaged web-based research) on 
usein tutkimustyyppi, jossa traditionaaliset testit ja kyselyt on tuotu 
verkkoympäristöön. Sillä on yleensä välitön interaktiivinen ja invasii- 
vinen suhde ihmisiin. Tähän tutkimustyyppiin myös usein sovelletaan 
traditionaalisia offline-tutkimuskoodeja. Fi-invasiivinen verkkotutkimus 
(engl. non-intrusive web-based research) jättää asiaintilat ennalleen vaikut- 
tamatta niihin suoraan (Kitchin 2008). Erilaiset big data -työkalut (engl. 
harvesting, mining, scraping) ja internetkäyttäytymistä seuraavat tekno- 
logiat (engl. profiling, observation, recording) keräävät yleensä olemassa 
olevasta datamassasta piirteitä. Nämä teknologiat toimivat internetkäyt- 
täjän havainnon ulkopuolella, huomaamattomasti, eikä henkilöllä ole 
interaktiivista suhdetta tutkimuksen kanssa. Tutkimustyyppi ymmärre- 
tään siksi epäsuoraksi ja ei-invasiiviseksi: tutkimus ei muuta asioiden 
kulkua reaalitodellisuudessa. 

Jako invasiiviseen ja ei-invasiiviseen tutkimukseen on nähty jossain 
määrin samanlaisena kuin jako, joka on tehty ihmiseen kohdistuvan 
tutkimuksen ja tekstintutkimuksen välille (McKee & Porter 2009). 
Ihmistutkimuksessa tutkijalla on interaktiivinen suhde tutkittaviin, ja 
tekstintutkimuksessa tutkija analysoi ihmisten kirjallisia tuotoksia. Ka- 
tegorioiden välille voi myös olettaa jatkumon, jossa tutkittavaa aineistoa 
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voi jäsentää edelleen sen mukaan, onko aineisto yksityistä vai julkista, 
sensitiivistä vai neutraalia, interaktion vai julkaisemisen tulosta jne. 

Klassinen jako ihmiseen kohdistuvaan tutkimukseen ja tekstintutki- 
mukseen on kuitenkin ongelmallinen sähköisissä ympäristöissä kahdes- 
ta syystä. Ensiksi ihmistä ja hänen verkkokäyttäytymistään voi seurata 
reaaliajassa ja pitkienkin ajanjaksojen yli, mikä ei ollut aikaisemmin 
mahdollista. Sähköisessä ympäristössä voi määrittää, mitä joku lukee, 
katsoo tai sanoo, kuinka kauan ja kenen kanssa sekä mikä hänet saa 
kiinnostumaan, poistumaan tai jäämään sivulle. Yrityksillä on yksityis- 
kohtaista tietoa käyttäjistään tavalla, joka ei aikaisemmin ollut mahdol- 
lista. Tämä tarkkailu ei ole invasiivista, eikä verkkosurffaaja yleensä edes 
tiedä, kuinka monta ohjelmaa häntä seuraa tai mitä tietoja ne keräävät 
hänestä, hänen ystävistään ja perheestään. 

Toisekseen ihminen ja hänen ilmaisunsa ovat periaatteessa toisistaan 
erillisiä. Sähköisessä ympäristössä ihmisen tuotokset on aina medioitu 
teknologian kautta, ja ne ovat siten hänestä irrallaan. Tuotokset myös 
usein jäävät elämään digitaalista jatkoelämää niiden yritysten ja tutkijoi- 
den arkistoissa, joihin tuotokset on tallennettu. Sähköiseen ympäristöön 
jää digitaalinen jälki tavalla, joka on historiassa ainutlaatuinen. Tavalli- 
sen ihmisen arkielämästä tallentuu jälkiä lähes automaattisesti tuleville 
sukupolville. 

White (2002) on sitä mieltä, että kielelliset ilmaukset sähköisissä ym- 
päristöissä ovat tekstejä, ja vastustaa sitä, että online-tutkimuksissa käsi- 
teltäisiin tekstejä aivan kuin ne olisivat fyysisiä henkilöitä eikä erotettaisi 
elävää subjektia ja kulttuurisia tuotoksia toisistaan. Hänen mukaansa 
digitaalinen tutkimus ei edes periaatteessa voi olla ihmiseen kohdistu- 
vaa tutkimusta, sillä internetissä ei ole fyysisiä henkilöitä. 

Hyvin toisenlaisen näkemyksen tarjoaa Fairfield (2012), jonka mu- 
kaan henkilö-käsitettä olisi internetissä laajennettava, ei suinkaan ka- 
vennettava. Hän on käyttänyt termiä human harming research sellaisesta 
tutkimuksesta, joka on epäsuoraa mutta joka voi aiheuttaa vahinkoa 
tai tuskaa ihmiselle. Esimerkiksi virtuaalisissa maailmoissa avattaren 
(profiilikuva) vahingoittaminen voidaan tulkita ihmisen identiteettiä 
loukkaavaksi teoksi. Vaikka avatar ei ole ihminen vaan representaa- 
tio jostakin ihmiselle itselleen tärkeästä asiasta (Fairfield 2012), se on 
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kuitenkin osa hänen henkilöään. Fairfield (mt.) laajentaisi henkilön kä- 
sitettä koskemaan virtuaalisissa ja sähköisissä ympäristöissä sellaisia 
ihmiselle tärkeitä asioita, joita vahingoittamalla ihmiselle voi tuottaa tus- 
kaa. Ihmisen identiteetti rakentuu sähköisissä ympäristöissä. Fairfield 
(mt.) ehdottaa, että esimerkiksi nimimerkille tai henkilökohtaiselle 
verkkosivustolle aiheutettu vahinko vertautuisi henkilövahinkoon. 

On myös esitetty käsite human non-subjects research (subjektiton ihmis- 
tiede). Brothers ja Clayton (2010) ovat käyttäneet termiä tutkimuksesta, 
jossa ihmistä koskevasta datasta on poistettu kaikki tunnisteet ja data kä- 
sitellään ja analysoidaan ihmisestä riippumatta. Tällöin data yhä selkeäs- 
ti koskee ihmistä, mutta siinä ei enää esiinny persoonallisia subjekteja, 
tunnistettavia henkilöitä. Datamassaa analysoidaan kokonaisuutena. 
Tämä subjektiton ihmiskorpus toimisi heidän näkemyksensä mukaan 
hieman samoin kuin kielitieteessä korpustutkimus: sen käsittely ei 
tuota harmia tai haittaa niille yksittäisille ihmisille, jotka tekstin ovat 
tuottaneet. 

Bruckman (2014) on kehottanut tutkijoita aktiivisesti osallistumaan 
tutkimuskohteen määrittelyyn nykyisessä tutkimuseettisessä mur- 
roksessa ja kehittämään myös uusia käsitteitä ja kategorioita. Vaa- 
rana on, että jos vain harvat osallistuvat keskusteluun, käy niin kuin 
biolääketieteessä: yhdestä tutkimustyypistä laajennetaan muihin tut- 
kimuksiin näihin soveltumattomia toimintakoodeja ja heikennetään 
tieteellisen tutkimuksen laatua ja toimintaedellytyksiä. Digitaalisessa 
ihmistieteessä tutkijan täytyy uudella käsitteellisellä välineistöllä osal- 
listua digitaalisen ympäristön tilallisen luonteen kuvaukseen, tulkintaan 
ja määrittämiseen. 


4.5.3. MITÄ ON TUNNISTEELLINEN JA 
EI-TUNNISTEELLINEN DATA? 

Tutkimusetiikassa periaatteena on pidetty, että tutkimus tulee suorit- 
taa siten, että tutkimukseen osallistuneita henkilöitä ei voida tunnistaa 
ja ettei kerätä tai julkaista sellaisia tietoja, jotka saattaisivat heidät vaa- 
raan, tahraisivat heidän mainettaan, hankaloittaisivat työllistymistä tai 
saattaisivat juridiseen edesvastuuseen. Tunnisteellisia tietoja saa kerätä 
vain erityisen tarpeellisissa tapauksissa, ja silloinkin näihin tietoihin 
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kohdistuvat ankarat salausvaatimukset. Suoria tunnisteita ovat nimi, 
henkilötunnus, henkilönimen mukainen sähköpostiosoite ja biometriset 
tunnisteet, esimerkiksi sormenjälki tai kasvokuva. Epäsuoriksi tunnis- 
teiksi nimitetään sellaisia tietoja, jotka yhdistettynä muihin tietoihin 
mahdollistavat henkilön tunnistamisen. Tällaisia ovat esimerkiksi suku- 
puoli, ikä, asuinpaikkakunta tai ammatti. 

Sähköiset ympäristöt ovat muuttaneet tunniste-käsitteiden sisältöä. 
Sähköisillä päätteillä, internetyhteyksillä ja -käyttäjillä on teknologisissa 
ympäristöissä sellaisia yksilöllisiä tunnisteita, joiden perusteella säh- 
köinen kommunikaatio on ylipäätään mahdollista. Laki ei toistaiseksi 
kiellä näiden tunnisteiden keräämistä, mutta sähköisissä ympäristöissä 
ne ovat viime kädessä sosiaaliturvatunnukseen verrattavissa olevia yksi- 
löiviä tunnisteita. 

Epäsuorat tunnisteet ovat nekin kategoriana laajentuneet. Tällä 
hetkellä on epäselvää, mikä ei ole epäsuoraa tunnistetta sähköisessä 
ympäristössä. Sähköiset ympäristöt ovat kehittyneet monikanava-alus- 
toiksi, joissa tietoja linkitetään. Haku pöytäkoneelta linkittyy matka- 
puhelimen paikkatietoihin, ja tabletissa avattu sähköposti vaikuttaa 
matkapuhelimen uutissyötteeseen. Ihmisen musiikkimaku voi kertoa 
hänen seksuaalisesta suuntautumisestaan, uutisvalinnat asuinpaikasta 
ja automerkki poliittisesta kannasta.” Sellainen tieto, joka eilen näytti 
neutraalilta, onkin tänään sellaista, jonka perusteella henkilö voidaan 
identifioida. Ihminen voidaan nyt tunnistaa uudenlaisen datan perus- 
teella ja hänestä tehdään sellaisia päätelmiä, joita hän ei ehkä haluaisi 
itsestään julkistaa. Miten ennustaa huomisen teknologisia innovaatioita 
ja niiden vaikutuksia ihmisiin, dataan ja tutkimuksen etiikkaan? 
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Facebookia vuonna 2018 ravistellut Cambridge Analytica -skandaali on vain yksi esi- 
merkki monien joukossa siitä, millaisia seurauksia voi olla sillä, että liikeyrityksille suo- 
daan sellaisia vapauksia, joita ei yhteiseen hyvään pyrkivälle akateemiselle tutkimukselle 
suotaisi. Cambridge Analytica käytti miljoonien Facebook-käyttäjien yksityistä informaa- 
tiota näiden henkilöiden ja heidän ystäviensä persoonallisuuspiirteiden profiloimiseen 
ja manipuloimiseen siten, että heihin saattoi kohdistaa yksilöllistä tunteisiin vaikuttavaa 
poliittista mainontaa ja siten vaikuttaa kansallisella tasolla eri maiden demokraattisiin 
vaaleihin. 

On hyvä huomata, että insinöörialoilla on ollut käytössä termi mikroetiikka samassa 
mielessä kuin tässä tekstissä käytetään tutkimusetiikkaa ja vastaavasti termi makro- 
etiikka samassa merkityksessä kuin tässä käytetään laajan vastuun etiikkaa (ks. esim. 
Hudspith 1991). 

https://www.tenk.fi/. 

Tierneyn (2000) mukaan antropologian alan ja kielitieteen ”epäpoliittiset” asenteet 
kenttätyössä ovat johtaneet ihmisoikeusloukkauksiin. Esimerkiksi Yanomameille 
(alkuperäiskansa Amazonian sademetsäalueella Brasilian ja Venezuelan rajalla) ei tarjot- 
tu antropologien ja lingvistien mukanaan tuomiin kulkutauteihin rokotteita sairauksien 
immunisoimiseen tai lääkkeitä niiden hoitoon. Tierney (mt.) esittää, että tutkija ei voi 
teeskennellä olevansa ulkopuolinen neutraali tarkkailija, sillä hänen läsnäolostaan on 
välttämättä aina seurauksia. 

LSA: https://www.linguisticsociety.org/sites/default/files/Ethics Statement.pdf. 
Ihmisarvoa loukkaavia lääketieteellisiä kokeita tehtiin laajasti myös keskitysleirien 


ulkopuolella sairaaloissa ja orpokodeissa — niin natsi-Saksassa kuin muuallakin maail- 
massa. Esimerkiksi Heidelbergin psykiatrisessa sairaalassa Carl Schneider tappoi lapset 
kokeiden jälkeen tutkiakseen histopatologisia diagnoosejaan. Wienissä Elmar Turk ja 
Heinrich Gross käyttivät lastensairaaloissa samaa menetelmää diagnoosiensa varmis- 
tamiseksi. Vuosina 1942 ja 1943 Itävallan lastensairaaloissa tapettiin lääketieteellisissä 
kokeissa ainakin 800 lasta (Weindling 2008). Keskitysleirien ulkopuolella tehdyistä 
kokeista vain harva päätyi oikeuteen. Epäeettisiä kokeita ja niiden tutkimustuloksia on 
kyseenalaistettu vain vähän. Carl Schneiderin miniä perusti 1946 väitöskirjansa appensa 
tutkimustuloksiin. Heinrich Gross julkaisi teoriansa vuonna 1952, ja Elmar Turkin paloit- 
telemien lasten ruumiinosia käytettiin eri yliopistoissa (Weindling 2008). 

YK:n ihmisoikeusjulistuksen artikla 7, International Covenant on Civil and Political Rights, 
lausuu seuraavasti: ”No one shall be subjected to torture or to cruel, inhuman or degra- 
ding treatment or punishment. In particular, no one shall be subjected without his free 
consent to medical or scientific experimentation.” 

https: //www.tenk.fi/sites/tenk.fi/files/eettisetperiaatteet.pdf. 

Esim. https://www.linguisticsociety.org/sites/default/files/lsa-stmt-research-hu- 


man-subjects.pdf. 


APA: www.apa.org. 
Googlen algoritmit lukevat sivustojen sisältöä, mistä syystä ne antavat myös ohjeita, 
millaiset sivustot ovat helposti koneluettavia. Yritysten ja sivustojen tarve tulla nähdyksi 
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Googlen hauissa on johtanut sivustojen hyvin homogeeniseen ulkoasuun. Tietynlaisen 
ulkoasun omaavaan sivustoon voidaan koneellisesti sijoittaa mainoksia. AdWords on 
tällaiseen soveltuva mainosohjelma, joka sijoittaa sivuille käyttäjäprofiloinnin mukaista 
kaupallista mainossisältöä. Näistä mainoksista Google saa pääasiallisen liikevoittonsa. 

12 Facebook-ryhmiä on vuonna 2019 kolmessa kategoriassa. ”Avoin” tarkoittaa, että ryh- 
mä, ryhmän jäsenet ja kommentit näkyvät kaikille, myös ei-jäsenille. ”Suljettu” tarkoit- 
taa, että ryhmä ja sen jäsenet näkyvät yleisölle mutta keskustelu näkyy vain jäsenille. 
”Salainen” tarkoittaa, että ryhmän jäseneksi voi tulla vain kutsusta eikä ryhmää, sen 
jäseniä tai keskustelua näy ulkopuolisille. Monilla muilla foorumeilla on yleensä vain 
kaksi vaihtoehtoa: avoin keskustelu, joka on julkinen, ja suljettu keskustelu, joka näkyy 
vain jäsenille. Hudson ja Bruckman (2005) käyttävät termejä avoin ja suljettu tässä diko- 
tomisessa merkityksessä. 

13 Juuri tällaisia epäsuoria tunnisteita käytettiin Cambridge Analytica -tapauksessa vuonna 
2016 USA:n presidentinvaalien yhteydessä identifioimaan ihmisten persoonallisuustyyp- 
pejä. Epäsuorat tunnisteet ennustivat luotettavasti sitä, miten ihminen reagoi erilaisiin 
kielellisiin ja visuaalisiin viesteihin. (Cadwalladr & Graham-Harrison 2018.) 


KIRJALLISUUS 


AAAL. 2011. AAAL resolution against discrimination on the basis of accented speech. 
[verkkoaineisto]. [viitattu 10.4.2019]. Saatavissa: https://www.aaal.org/position- 
statements#Feb-201. 

ALAA. 1998. The Applied Linguistics Association of Australia: Recommendations on good 


practice in Applied Linguistics. [verkkoaineisto]. [viitattu 11.4.2019]. 
APA = American Psychological Association. 2010. Publication Manual of the American 
Psychological Association. (6. p.). Washington (DC): American Psychological Association. 
BAAL = The British Association for Applied Linguistics. 2006. Recommendations on good 
practice in Applied Linguistics. [verkkoaineisto]. [viitattu 11.4.2019]. Saatavissa: https://www. 
baal.org.uk/wp-content/uploads/2017/08/goodpractice_full.pdf. 


Brothers, Kyle B. & Clayton, Ellen W. 2010. Human non-subjects research: privacy and 
compliance. The American Journal of Bioethics 10:9, 15-17. 

Bruckman, Amy. 2002. Ethical guidelines for research online. (Versio: 4/4/02). 
[verkkoaineisto]. [viitattu 9.4.2019]. Saatavissa: http://documents.kenyon.edu/provost/ 
irb_ethics_online.pdf. 

Bruckman, Amy. 2006. Teaching students to study online communities ethically. Journal of 
Information Ethics 15:2, 82-98. 

Bruckman, Amy. 2014. Research ethics and HCI. Julkaisussa: Olson, Judith S. & Kellogg, 
Wendy A. (toim.) Ways of Knowing in HCI. New York (NY): Springer, 449-468. 

Buchanan, Elizabeth A. 1999. An overview of information ethics issues in a world-wide 
context. Ethics and Information Technology 1:3, 193-201. 

Buchanan, Tom. 2000. Potential of the Internet for personality research. Julkaisussa: 


JOHDANTO $4. KIELITIETEEN ETIIKKA — HYVA TUTKIMUS MURROKSESSA 187 


Birnbaum, Michael H. (toim.) Psychological Experiments on the Internet. San Diego (CA): 
Academic Press, 121-140. 

Cadwalladr, Carole & Graham-Harrison, Emma. 2018. The Cambridge analytica files. The 
Guardian 21, 6-7. 

Clarkeburn, Henriikka & Mustajoki, Arto. 2007. Tutkijan arkipäivän etiikka. Tampere: 
Vastapaino. 

Costa, Peter |. de (toim.). 2015. Ethics in Applied Linguistics Research: Language Researcher 
Narratives. New York (NY): Routledge. 

Creswell, John W. & Creswell, J. David. 2017. Research Design: Qualitative, Quantitative, and 
Mixed Methods Approaches. (5. p.). Thousand Oaks (CA): Sage. 

Curtiss, Susan. 1977. Genie: A Psycholinguistic Study of a Modern-Day ”Wild Child”, 
Perspectives in Neurolinguistics and Psycholinguistics. Boston (MA): Academic Press. 

Dorian, Nancy C. 1993. A response to Ladefoged’s other view of endangered languages. 
Language 69:3, 575-579. 

Eaton, Margaret L. & Kennedy, Donald L. 2007. Innovation in Medical Technology: Ethical 
Issues and Challenges. Baltimore (MD): John Hopkins University Press. 

Fairfield, Joshua A. 2012. Avatar experimentation: Human subjects research in virtual 
worlds. UC Irvine Law Review Vol. 2, 695. Washington & Lee Legal Studies Paper No. 
2012-26. 

Fossey, Ellie, Harvey, Carol, McDermott, Fiona & Davidson, Larry. 2002. Understanding 
and evaluating qualitative research. Australian and New Zealand Journal of Psychiatry 36:6, 
717-732. 

Foucault, Michel. 1982. The subject and power. Critical Inquiry 8:4, 777-795. 

Gadamer, Hans-Georg. 1976. Philosophical Hermeneutics. Kääntänyt David Linge. Berkeley: 
University of California Press. 

Graham, Loren R. 1981. Between science and values. New York (NY): Columbia University 
Press. 

Hallamaa, Jaana, Launis, Veikko, Lötjönen, Salla & Sorvali, Irma (toim.). 2006. Etiikkaa 
ihmistieteille. Tietolipas 211. Helsinki: Suomalaisen Kirjallisuuden Seura. 

Hudson, James M. & Bruckman, Amy. 2005. Using empirical data to reason about internet 
research ethics. Julkaisussa: ECSCW'os Proceedings of the Ninth Conference on European 
Conference on Computer Supported Cooperative Work. Dordrecht: Springer, 287—306. 

Hudspith, Robert. 1991. Broadening the scope of engineering ethics: From micro-ethics to 
macro-ethics. Bulletin of Science, Technology & Society 11:4—5, 208-211. 

Hunter, David & Evans, Nicholas. 2016. Facebook emotional contagion experiment 
controversy. Research Ethics 12:1, 2—3. 

Introna, Lucas D. & Nissenbaum, Helen. 2000. Shaping the Web: Why the politics of 
search engines matters. The Information Society 16:3, 169—185. 

Irigaray, Luce. 2017. To Speak is Never Neutral. New York (NY): Routledge. 

Jones, Peter. 1995. Contradictions and unanswered guestions in the Genie case: a fresh 
look at the linguistic evidence. Language and Communication 15, 261—280. 

Kimmel, Allan J. 1996. Ethical Issues in Behavioral Research: Basic and Applied Perspectives. 
Oxford: Wiley-Blackwell. 


188 REETTA KONSTENIUS 


itchin, Heather A. 2008. Research Ethics and the Internet: Negotiating Canada’s Tri-Council 
Policy Statement. Black Point: Fernwood Publishing Co. Ltd. 

onstenius, Reetta A. 2014. Empiria, eksperimentti ja etiikka. Kielitieteen metateoriaa. 
Helsinki: Helsingin yliopisto. 

risteva, Julia. 1988. The system and the speaking subject. Julkaisussa: Newton, K. M. 
(toim.) Twentieth-Century Literary Theory a Reader. London: Macmillan, 180-185. 
ubanyiova, Magdalena. 2008. Rethinking research ethics in contemporary applied 
linguistics: The tension between macroethical and microethical perspectives in situated 
research. The Modern Language Journal 92:4, 503-518. 

Lagström, Hanna, Pösö, Tarja, Rutanen, Niina & Vehkalahti, Kaisa. 2015. Lasten ja nuorten 
tutkimuksen etiikka. Helsinki: Yliopistopaino. 

Länsimies-Antikainen, Helena. 2008. Ihmisten tutkimiseen liittyviä eettisiä kysymyksiä: 
pohdintaa tietoon perustuvasta suostumuksesta. Julkaisussa: Pietilä, Anna-Maija & 
Länsimies-Antikainen, Helena (toim.) Etiikkaa monitieteisesti. Pohdintaa ja kysymyksiä. 


Kuopio: Kuopion yliopisto, 91-108. 
Löppönen, Paavo (toim.). 1991. Tiede ja etiikka. Porvoo: WSOY. 
Lötjönen, Salla. 1999. Tutkijan ammattietiikka. Tutkimuseettinen neuvottelukunta. Koulutus- 
ja tiedepolitiikan osaston julkaisusarja. Nro. 69. Helsinki: Opetusministeriö. 
McKee, Heidi A. & Porter, James E. 2009. The Ethics of Internet Research: A Rhetorical, Case- 
based Process. Bern: Peter Lang. 
Moor, James H. 1985. What is computer ethics? Metaphilosophy 16:4, 266—275. 
Munro, Pamela. 2000. Field linguistics. Julkaisussa: Aronoff, Mark & Rees-Miller, Janie 
(toim.) The Handbook of Linguistics. Oxford: Blackwell Publishers, 130-149. 
Mäkelä, Klaus. 2005. Sosiaalitutkimuksen eettinen sääntely. Yhteiskuntapolitiikka 70:4, 
386—395. 
Mäkelä, Klaus. 2007. Lääketieteen etiikka ja yhteiskuntatutkimuksen 
ennakkosäätely. Tieteessä tapahtuu 25:1, 21—27. 
Niiniluoto, Ilkka & Sihvola, Juha. 2005. Nykyajan etiikka. Keskusteluja ihmisestä ja 

yhteisöstä. Helsinki: Gaudeamus. 


Orlitzky, Marc. 2017. Virtue signaling: Oversocialized ”integrity” in a politically correct 
world. Julkaisussa: Orlitzky, Mark & Monga, Manjit (toim.) Integrity in Business and 
Management. London: Routledge, 190—206. 

Percival, Thomas. 1803. Medical Ethics, Or a Code of Institutes and Precepts Adapted to 
the Professional Conduct of Physicians and Surgeons: To which is Added an Appendix. 
Manchester: S. Russell for J. Johnson. 

Pietarinen, Juhani & Launis, Veikko. 2002. Etiikan luonne ja alueet. Julkaisussa: Karjalainen, 
S., Launis, V., Pelkonen, R. & Pietarinen, J. (toim.) Tutkijan eettiset valinnat. Helsinki: 
Gaudeamus, 42-57. 

Pirttilä, Tuula. 2008. Tutkimuseettiset toimikunnat — toimintaa ohjaavat normit ja 
tutkimuseettinen pohdinta. Julkaisussa: Pietilä, A. M. & Länsimies-Antikainen, H. (toim.) 
Etiikkaa monitieteisesti. Pohdintaa ja kysymyksiä. Kuopio: Kuopion yliopisto, 65-89. 

Roelcke, Volker & Maio, Giovanni. 2004. Twentieth Century Ethics of Human Subjects 
Research: Historical Perspectives on Values, Practices and Regulations. Stuttgart: Verlag. 


JOHDANTO 4. KIELITIETEEN ETIIKKA — HYVÄ TUTKIMUS MURROKSESSA 189 


Ross, Monique. 2014. Facebook turns 10: The world’s largest social network in numbers. 
ABC News. [verkkoaineisto]. [viitattu 14.3.2019]. Saatavissa: http: //www.abc.net.au/ 
news/2014-02-04/facebook-turns-10:-the-social-network-in-numbers/5237128. 

Rymer, Russ. 1992. Genie an Abused Child’s Flight from Silence. New York (NY): Harper 
Collins Publishers. 

Tierney, Patrick. 2000. Darkness in El Dorado: How Scientists and Journalists Devastated the 
Amazon. New York (NY): W. W. Norton & Company. 

Vaux, Bert & Cooper, Justin. 1999. Introduction to Linguistic Field Methods. Munich: Lincom 


Europa. 

Weindling, Paul J. 2008. The Nazi medical experiments. Julkaisussa: Emanuel, Ezekiel, 
Grady, Christine, Miller, Franklin G., Crouch, Robert A. & Lie, Reidar K. (toim.) The Oxford 
Textbook of Clinical Research Ethics. New York (NY): Oxford University Press, 18-30. 

White, Michele. 2002. Representations or people? Ethics and Information Technology 4:3, 
249-266. 

Wiberg, Matti. 2006. Yhteiskuntatiede ja kohteen vahingoittaminen. Julkaisussa: Hallamaa, 
Jaana, Launis, Veikko, Lötjönen, Salla & Sorvali, Irma (toim.) Etiikkaa ihmistieteille. 
Tietolipas 211. Helsinki: Suomalaisen Kirjallisuuden Seura, 261-273. 

Wolfram, Walt. 1993. Ethical considerations in language awareness programs. Issues in 
Applied Linguistics 4:2, 225-255. 

Zimmer, Michael. 2010. ”But the data is already public”: on the ethics of research in 
Facebook. Ethics and Information Technology 12:4, 313-325. 

Zimmer, Michael & Proferes, Nicholas John. 2014. A topology of Twitter research: 
disciplines, methods, and ethics. Aslib Journal of Information Management 66:3, 250—261. 


190 REETTA KONSTENIUS 


5. Tämä kokoelma 


Milla Luodonpää-Manni 
O https://orcid.org/0000-0002-1646-4462 


Markus Hamunen 
O https://orcid.org/0000-0003-2786-6392 


5.1. Kokoelman rakenne 


Tämä teos jakautuu neljään osaan: tähän laajaan, mutta ei tyhjentä- 
vään, tutkimuksen perusteisiin ja käytäntöön opastavaan johdantoon 
(osa 1), kielentutkimuksen aineistonkeruu- ja analyysimenetelmiä kä- 
sittelevään osaan 2 (luvut 1-11), kielellisen monimuotoisuuden selvit- 
telyyn soveltuvia menetelmiä esittelevään osaan 3 (luvut 12-16) sekä 
esimerkkitapauksia menetelmällisestä kirjosta kielentutkimuksen eri 
alueilla esittelevään osaan 4 (luvut 17—24). Kokoelma sisältää yhteen- 
sä 24 kielentutkimuksen eri menetelmiä ja suuntauksia esittelevää 
lukua, joissa avataan tiivistetysti alan perusteita ja ohjataan lukijaa 
yksityiskohtaisemman tiedon lähteille. Kirjoittajina toimivat aina ky- 
seisen menetelmän asiantuntijat. Teoksen laatimiseen on osallistunut 
yhteensä 46 kirjoittajaa. Teos pyrkii kuvaamaan suomalaisen kielen- 
tutkimuksen kenttää mahdollisimman laajasti kurkottaen monilta osin 
kielentutkimuksen tyypillisimpien alueiden (esim. rakenteen ja merki- 
tyksen kuvaaminen) ulkopuolelle. Valinta on tietoinen, ja sillä pyritään 
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lisäämään kielentutkimuksen alueiden välistä dialogia. Tätä dialogia 
edistetään myös runsailla kokoelman sisäisillä viittauksilla lähialoja 
esitteleviin kirjoituksiin. Samalla lukijaa perehdytetään tieteenalan ra- 
kenteisiin ja tarjotaan lisätietoa käsiteltävästä aiheesta. 

Koska kyseessä on ensimmäinen suomenkielinen kielentutkimuksen 
metodologiaan keskittyvä laaja kokoelma, kirjoituksissa metodeja ja 
niiden historiaa esitellään erityisesti suomalaisesta näkökulmasta. 
Metodien kuvaukset on kirjoitettu mahdollisimman konkreettisella 
ja käytännönläheisellä otteella, ja usein näytetään askel askeleelta esi- 
merkkejä siitä, miten menetelmää käytetään. Kokoelmassa termien 
tarkkaan määrittelyyn on kiinnitetty erityistä huomiota, koska termien 
käytössä voi olla eroja kielentutkimuksen eri alueilla. Mahdollisuuksien 
mukaan käytämme myös suoria ulkoisia linkkejä esimerkiksi Tieteen 
termipankkiin, mikä on mahdollista teoksen sähköisen julkaisemisen 
ansiosta. Lukijan työtä pyritään helpottamaan myös visuaalisesti erottu- 
villa metodien keskeisiä piirteitä esittelevillä tietolaatikoilla ja lukijalle 
tarjottavalla lisälukemistolla. 

Kokoelman johdannossa (osa 1) on perehdytty tutkimuksenteon eri 
vaiheisiin ja pohdittu yleisellä tasolla perustavia tieteen metodologisia ja 
tutkimusetiikkaan liittyviä kysymyksiä sekä erityisiä kielentutkimuksen 
menetelmiä koskevia kysymyksiä. Vaikka johdantoon on pyritty kerää- 
mään kielentutkimusta yhteisesti koskevia periaatteita, teoksen muut 
luvut on laadittu siten, että ne toimivat myös itsenäisesti luettuina ku- 
ten perinteiset tieteelliset artikkelit. Eri menetelmiin liittyvistä erityis- 
kysymyksistä, kuten tutkimuseettisistä erityispiirteistä, keskustellaan 
tarvittaessa syvällisemmin kunkin menetelmäluvun yhteydessä. Lisäksi 
teoksessa on paikoin säilytetty pientä toisteisuutta, jotta luvut toimisivat 
silläkin tavoin paremmin itsenäisinä kokonaisuuksina. 

Kokoelman johdantoa seuraavassa toisessa osassa (luvut 1-11) kä- 
sitellään erilaisia aineistotyyppejä, aineistonkeruuseen liittyviä kysy- 
myksiä sekä menetelmiä, joiden avulla aineistoja voidaan analysoida. 
Osa koostuu luvuista Kielitaju kielentutkijan työkaluna, Kysely, Haastat- 
telu aineistonkeruun metodina sosiolingvistiikassa, Kokeellinen fonetiikka, 
Lingvistinen etnografia toimintayhteisöissä, Diskurssianalyysi, Laadulli- 
nen aineistopohjainen kielentutkimus, Käsiteanalyysi kielentutkimuksessa, 
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Korpusaineistot, Määrällinen korpuslingvistiikka ja Historiallinen 
korpuslingvistiikka. 

Kokoelman kolmannessa osassa (luvut 12-16) esitellään kielellisen 
monimuotoisuuden selvittelyyn soveltuvia menetelmiä. Kolmannen 
osan lukuja ovat Kielikontaktien tutkimus, Kielten dokumentointi ja kieli- 
opin kuvaus, Kielitypologian menetelmät, Historiallinen ja vertaileva kielen- 
tutkimus sekä Antropologinen lingvistiikka. 

Kokoelman neljännessä osassa (luvut 17—24) tarkastellaan eräitä mui- 
ta tutkimussuuntauksia menetelmälliseltä kannalta, ja se käsittää luvut 
Kieliopin tutkimus ja kielioppiteoriat, Näkökulmia filologiseen tutkimukseen, 
Nimistöntutkimus, Tekstintutkimus, Sosiolingvistiikka, Keskustelunanalyysi 
ja vuorovaikutuslingvistiikka, Käännöstiede ja sen menetelmät sekä Psyko- ja 
neurolingvistiikka. 

Kielentutkimuksessa analyysimenetelmät ovat usein sidoksissa tiet- 
tyihin tutkimussuuntauksiin, eikä tarkkaa jakoa metodien ja suunta- 
usten kesken käytännössä aina voida tehdä. Tämä käy ilmi myös ko- 
koelman lukujen teemoista (ks. myös kokoelman Alkusanat). Siirtymä 
yksittäisistä metodeista erilaisiin laajempiin tutkimussuuntauksiin ja 
monimenetelmäisiin tutkimusasetelmiin on todellisuudessa portaaton, 
vaikka teoksessa on tehty jako näiden välille teoksen jäsentämiseksi. 

Vaikka monet perinteisesti kielentutkimuksessa analysoidut raken- 
teen ja merkityksen tasot, kuten fonologia (äänneoppi), morfologia 
(muoto-oppi), semantiikka (merkitysoppi) ja syntaksi (lauseoppi), eivät 
näy kokoelmassa otsikkotasolla, tämän teoksen luvut tarjoavat kuiten- 
kin monipuolisesti metodisia välineitä myös näiden ja monien muiden 
kielentutkimuksen kohteiden tarkasteluun. Luvut on järjestetty kokoel- 
massa löyhien temaattisten periaatteiden mukaan, eikä niiden esittämis- 
järjestyksellä näin ollen oteta arvottavaa kantaa eri menetelmien ja 
suuntausten väliseen järjestykseen. 

Tämän kokoelman yhtenä tavoitteena on ylittää kielentutkimuksen 
eri alueiden välisiä raja-aitoja sekä vahvistaa kielentutkimuksen me- 
todologian asemaa osana tieteenalan keskustelukulttuuria, rakentei- 
ta ja käytänteitä. Parhaassa tapauksessa teos toimii sysäyksenä meta- 
teoreettisten julkaisujen ja toiminnan runsastumiseen suomalaisessa 
kielentutkimuksessa. 
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5.2. Kielentutkimuksen muita metodioppaita ja 
perusteoksia suomeksi 


Viime aikoina kielentutkimuksen menetelmiä käsitteleviä teoksia on 
kirjoitettu suomen kielellä jonkin verran. Yleensä ne keskittyvät jonkin 
tietyn kielentutkimuksen suuntauksen metodiikan kuvaukseen, sillä 
kielentutkimusta harjoitetaan erilaisten suuntausten piirissä ja niissä 
erilaisin eriytynein menetelmin. 

Tainio (1997) on ensimmäinen suomeksi kirjoitettu keskustelun- 
analyysin perusteita esittelevä oppikirja. Stevanovic ja Lindholm (2016) 
päivittää keskustelunanalyysin tutkimusprosesseja esittelemällä tuoretta 
keskustelunanalyyttista tutkimusta, ja teos avaa siten uusia näkökulmia 
keskustelunanalyysin hyödyntämiseen. Myös jo suomennoksessa Heritage 
(1996 [1984]) käsitellään keskustelunanalyysin metodologisia perusteita. 

Oittinen ja Mäkinen (2001) on ensimmäinen suomeksi kirjoi- 
tettu kääntämisen ja tulkkauksen perusteita esittelevä yleistajuinen 
kirja. Oittinen ja Tuominen (2007) tarjoaa puolestaan kattavan yleis- 
katsauksen av-kääntämisestä. Aaltonen, Siponkoski ja Abdallah (2015) 
päivittää uusia näkökulmia käännösviestintään keskittyen erityisesti 
käyttäjäkeskeiseen kääntämiseen. 

Ruusuvuori ja Tiittula (2005) on monitieteinen oppikirja erilaisis- 
ta haastatteluista, haastattelutilanteen rakentumisesta sekä menetel- 
män historiasta. Haastatteluaineiston analyysiin käytännöllisen pe- 
rehdytyksen tarjoaa puolestaan Ruusuvuori, Nikander ja Hyvärinen 
(2010). Tutkimushaastattelusta on ilmestynyt myös käsikirja, Hyväri- 
nen, Nikander ja Ruusuvuori (2017), joka opastaa yksityiskohtaisesti 
haastattelututkimuksen käytäntöön ja esittelee haastattelun eri lajeja. 
Seuri (2020) avaa haastattelua journalismin näkökulmasta, mistä on 
hyötyä myös tutkimustyössä. 

Mäntynen, Shore ja Solin (2006) on ensimmäinen suomenkielinen 
tekstilajeja käsittelevä teos. Heikkisen, Voutilaisen, Lauerman, Tiililän 
ja Lounelan (2012a) kattava käsikirja keskittyy niin ikään tekstilajitutki- 
mukseen ja sen käsitteisiin. Sen parina toimii tekstilajien tutkimuksen 
käytäntöön opastava Heikkinen, Voutilainen, Lauerma, Tiililä ja Lounela 
(2012b), joka on verkossa avoimesti saatavissa. 
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Suomi, Toivanen ja Ylitalo (2006) on perusteos suomen kielen fo- 
netiikasta, mutta se soveltuu hakuteokseksi monien muidenkin alojen 
opiskelijoille. Kattava kokoomateos foneettisesta tutkimuksesta on myös 
Iivonen (2005). 

Ainiala, Saarelma ja Sjöblom (2008) on ensimmäinen suomek- 
si kirjoitettu nimistöntutkimuksen perusteita esittelevä oppikirja ja 
hakuteos. 

Itkonen (2008-2010) on kolmiosainen suomenkielinen perusteos 
kielitypologiasta. Siinä esitellään kielitypologian eri osa-alueita. 

Karlsson (2015 [2008]) on yleisesitys kielentutkimuksen perusteista 
ja kielen rakenteen tutkimuksen perinteisistä osa-alueista (esim. fone- 
tiikka, fonologia, morfologia). Siinä on myös tiivis luku kielitieteen me- 
todiikasta. Myös Häkkinen (2007) on yleisen kielitieteen perusteos, joka 
sopii kaikille kielitieteen teoriasta kiinnostuneille. 

Idström ja Sosa (2009) on monipuolinen kokoelma kielten ja kult- 
tuurien vuorovaikutukseen keskittyviä artikkeleita. 

Ojutkangas, Larjavaara, Miestamo ja Ylikoski (2009) tarjoaa merkitys- 
lähtöisen esityksen kielestä ja kielentutkimuksesta. Teos käsittelee kieliä 
kielitypologisesta, maailmanlaajuisesti kieliä vertailevasta näkökulmasta. 

Pietikäinen ja Mäntynen (2009) on diskurssintutkimuksen perus- 
teos, joka avaa havainnollisesti diskurssintutkimuksen käsitteitä ja 
sovelluksia. Ajantasaistettu laitos tästä on Pietikäinen ja Mäntynen 
(2019). Jokisen, Juhilan ja Suonisen (2016) teos yhdistää aiemmat oppi- 
kirjat Diskurssianalyysin aakkoset ja Diskurssianalyysi liikkeessä. 

Hiekkalinna ja Seppänen (2010) esittelee klassisen filologian lähteitä, 
lähestymistapoja ja metodeja. 

Itkonen ja Pajunen (2010) tarkastelee empiirisen kielitieteen kenttää 
ja kielentutkimuksessa käytettyjä metodeja. Se argumentoi metodien 
välisten edellyttämyssuhteiden puolesta. 

Korpilahti, Aaltonen ja Laine (2010) on monitieteinen oppikirja, joka 
antaa vankan tiedollisen pohjan kielen ja aivojen yhteistoiminnasta. 
Teos esittelee muun muassa puheen ja kielen kehityksen eri vaiheita, 
kielen häiriöitä ja kuntoutuksellisia ratkaisuja. Puheterapiaan vuoro- 
vaikutuksellisesta näkökulmasta pureutuu Sellman ja Tykkyläinen 


(2017). 
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Kalaja, Alanen ja Dufva (2011) on tutkielman laadintaan tarkoitettu 
opas, joka soveltuu soveltavan kielentutkimuksen ja erityisesti kielen 
oppimisen tutkimuksen opiskelijoille. 

Kolehmaisen, Miestamon ja Nordlundin (2013) kattava ja uusia inno- 
vaatioita sisältävä teos keskittyy erityisesti vertailun menetelmiin kielen- 
tutkimuksen eri alueilla. 

Vehkalahti (2019) on käytännöllinen opas erityisesti kyselyjen suun- 
nitteluun ja toteuttamiseen, mutta siinä avataan myös tilastollisia me- 
netelmiä ja käsitteitä. 
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Mika? 


Kielitaju on kokoava nimitys erilaisille metakielellisille taidoille ja tie- 
doille. Sillä tarkoitetaan ennen kaikkea äidinkielisen puhujan ymmär- 
rystä omasta kielestään. Se koskee muun muassa kielenmukaisten ja 
kielenvastaisten ilmausten tunnistamista. Jonkinlainen kielitaju on kai- 
killa kielenpuhujilla omasta äidinkielestään, mutta myös vierasta kieltä 
opittaessa syntyy sitä koskeva kielitaju. Se kehittyy vuorovaikutuskoke- 
musten, reflektoinnin ja osin myös formaalin koulutuksen myötä. Kielen- 
tutkimuksen metodina kielitaju on erikseen harjaannutettava taito, jota 
voi käyttää joko sellaisenaan tai muiden metodien, esimerkiksi korpus- 
tutkimuksen, tukemana. Kielitaju toimii välttämättömänä edellytyksenä 
monen muun metodin taustalla. Tavallisin kielitajun sovellusalue on ol- 
lut erilaisten kielioppien kirjoitus sekä teoreettinen kielentutkimus. 
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Katso myös: 


Johdannon luku 3. Monimenetelmäisen kielentutkimuksen metateoreet- 
tisia lähtökohtia 


Luku 2 Kysely 
Luku 9 Korpusaineistot 
Luku 13 Kielten dokumentointi ja kieliopin kuvaus 


Luku 17 Kieliopin tutkimus ja kielioppiteoriat 


1. Johdanto 


Suomea äidinkielenään (ensikielenään) puhuva tietää, että ilmaus tämä 
punainen talo on kielessä hyväksyttävä, kun taas *talo punainen tämä ei 
ole." Mihin tieto perustuu? Mistä juontuu tuntemamme varmuus siitä, 
että ilmauksista vain ensimmäinen on hyväksyttävä ja toinen kielen- 
vastainen? Entä miksei jälkimmäinen ilmaus muutu kertaheitolla hy- 
väksyttäväksi, vaikka kirjoittaisit sen tuhat kertaa erilaisille internetin 
keskustelupalstoille ja väittäisit sitten, että kyllä se suomea on, koska se 
esiintyy aidossa kielenkäytössä?” 

Äidinkieltä koskeva tieto, jota usein kutsutaan kielitajuksi, kohdistuu 
puhujayhteisölle yhteiseen normijärjestelmään, jota yksi puhuja ei pysty 
mielivaltaisesti muuttamaan. Kieltä opetteleva lapsi omaksuu tiedon täs- 
tä järjestelmästä ja sitä myötä kielitajun, joka edellä kuvatun kaltaisissa 
selvissä tapauksissa kertoo, mikä kielessä on mahdollista ja mikä ei. 
Kielen sääntöjä on usein verrattu pelin, esimerkiksi shakin, sääntöihin: 
tietynlaiset siirrot ovat pelin sääntöjen mukaisia, toiset eivät. Säännöt 
ovat pelaajien yhteisesti sisäistämät ja eri pelaajille samat. Niitä voi rik- 
koa, mutta tällöin pelaaja tekee virheen, ja vastustaja todennäköisesti 
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protestoi. Normijärjestelmän yhteisyys mahdollistaa sen, että kielellinen 
kommunikointi ylipäänsä voi onnistua. (Normatiivisuudesta ks. Mäki- 
lähde, Leppänen & Itkonen 2019.) 

Kielitaju on myös kielentutkijan välttämätön ja väistämätön työkalu, 
jota tutkija voi käyttää apunaan karkeasti ottaen kolmessa tutkimuksen 
eri vaiheessa: 1) tutkimusongelman hahmottamisessa ja tutkimuksen 
suunnittelussa, 2) tutkimusaineiston tuottamisessa esimerkkejä se- 
pittämällä ja 3) tutkimusaineiston analysoinnissa. Suurin osa kielen- 
tutkimuksesta, myös tiukasti korpusten käyttöön pohjautuva empiirinen 
tutkimus, hyödyntää kielitajua ainakin kohdassa 1 ja usein myös koh- 
dassa 3, kun empiirisistä havainnoista tehdään kvalitatiivisia päätelmiä. 
Sitä vastoin kohta 2 erottaa kielentutkimuksen suuntauksia toisistaan, 
ja sen luotettavuudesta on viime vuosikymmeninä käyty melko paljon 
keskustelua (fennistiikassa mm. Huumo 2007; Ojutkangas 2008; Jan- 
tunen 2009). Kohta 2 edellyttää yleensä sitä, että tutkija on tutkittavan 
kielen äidinkielen tasoinen puhuja. Tutkimuksen aineistona on yleensä 
standardoitu kielimuoto, esimerkiksi suomen yleiskieli, mutta huomat- 
tavasti harvemmin vapaa puhekieli tai esimerkiksi aluemurre, joissa 
esiintyy paljon variaatiota ja joita koskevat intuitiot eivät siksi ole yhtä 
vahvoja kuin jaettua yleiskieltä koskevat. 

Kielitajun käyttöä tutkimuksessa ja etenkin siihen nojautumista myös 
tutkimusaineiston tuottamisessa (kohta 2 edellä) on kutsuttu toisinaan 
intuitioksi ja toisinaan introspektioksi tarkoittaen samaa asiaa (Willems 
2012, 671-672; ks. myös Devitt 2014; Maynes & Gross 2013). Käytäm- 
me tässä artikkelissa pääsääntöisesti termiä kielitaju tekemättä tarkkaa 
terminologista eroa lähikäsitteiden kesken. Kielitaju kohdistuu puhuja- 
yhteisölle yhteiseen normiin, joka ei ole yksilöstä riippuvainen. Se seik- 
ka, että *talo punainen tämä ei suomessa ole hyväksyttävä, on puhuja- 
yhteisön yhteistä tietoa eikä yksittäisen puhujan mielipide tai mielle. 
Jokaisella puhujalla on kyllä yksilötasolla tieto tästä normista, mutta 
siihen liittyy samalla tieto siitä, että normi ei ole yksilökohtainen vaan 
koskee koko yhteisöä (yksilön kieltä koskevasta tiedosta ks. esim. Mills 
[ei vuotta]; Ludlow 2009). Voin esimerkiksi olettaa, että äidinkielinen 
keskustelukumppanini oudoksuisi ilmausta talo punainen tämä, mikäli 
sellaista käyttäisin. 
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Leonard Talmy (2007a) on verrannut kielitajuaan käyttävää kieli- 
tieteilijää urheilijaan, joka harjoittaa määrätietoisesti fyysisiä kykyjään. 
Samoin kielentutkija harjoittaa ja harjaannuttaa omaa kielitajuaan ha- 
vaitsemaan erilaisia säännönmukaisuuksia ja hienoja merkitysvivahtei- 
ta, joita tavallinen puhuja ei välttämättä tiedosta tai osaa kielentää mutta 
joista hänkin voi tulla tietoiseksi, jos ne osoitetaan hänelle. Tutkittavaa 
kieltä äidinkielen tasoisesti hallitseva tutkija on tällöin luonnollisesti 
vahvoilla verrattuna tutkijaan, jolle tutkimuskohde on vieras kieli. Ero 
tulee erityisen vahvana esille, jos myös tutkittava aineisto on tarkoitus 
tuottaa tutkijan oman kielitajun avulla. Erinomaisestikin vierasta kieltä 
hallitsevan tutkijan on syytä suhtautua varovasti ilmausten itse muotoi- 
lemiseen, ja tällaisten ilmausten hyväksyttävyyttä ja merkitysvivahteita 
on aina syytä kysyä myös äidinkielisiltä puhujilta (jolloin tutkimuksen 
tukena käytetään kielenopasta; ks. Kielten dokumentointi ja kieliopin 
kuvaus tässä kirjassa). Myös äidinkielisen tutkijan on syytä olla varo- 
vainen silloin, kun itse muotoillut ilmaukset ovat esimerkiksi raken- 


teellisesti hyvin kompleksisia tai muuten erikoislaatuisia. Mitä kauem- 
mas etäännytään ns. selvistä tapauksista, sitä epävarmemmin kielitaju 
kertoo, mikä ilmauksen merkitys on tai missä kulkee hyväksyttävän ja 
ei-hyväksyttävän raja. Esimerkkejä tällaisen tutkimuksen ongelmallisuu- 
desta tarkastelee havainnollisesti Dabrowska (1996). 

Mahdollisen ja mahdottoman tai hyväksyttävän ja ei-hyväksyttävän 
ilmauksen välisten erojen pohtimisen lisäksi kielitaju on korvaamaton 
työkalu silloin, kun pohditaan ilmausten merkityseroja: onko esimerkik- 
si jonkin kielenaineksen esiintymä tietyssä kontekstissa merkitykseltään 
erilainen kuin toisenlaisessa kontekstissa? Johtaako ilmauksen yhden 
elementin korvaaminen toisella merkityksen muuttumiseen, ja jos joh- 
taa, niin millaiseen? Tällainen tutkimus operoi minimipareilla, joissa 
muunnellaan kielellisiä ilmauksia yleensä vain yhden piirteen suhteen 
ja tarkastellaan muunnoksen vaikutusta ilmauksen merkitykseen (esim. 
kettu kuoli kaivossa — kaivoon). Minimiparit ovat kontekstittomia, tutkijan 
itsensä konstruoimia ilmauksia, joiden tavoitteena on eristää parikkeja 
erottavan tekijän vaikutus niiden merkitykseen. Samoin kuin hyväksyt- 
tävyyttä koskeva intuitio myös tämä menetelmä toimii parhaiten silloin, 
kun havaittu merkitysero on selkeä ja yksiselitteinen. 
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Yksinomainen kielitajun ja erityisesti tutkijan itse konstruoimien esi- 
merkkien varassa operoiva kielentutkimus on viime vuosikymmenten 
aikana joutunut kritiikin kohteeksi (esim. Schiitze 1996). Osin kritiikki 
on ollut perusteltua, osin perustelematonta siksi, että kielitajun varaisen 
tutkimuksen on oletettu pyrkivän sellaisiinkin tavoitteisiin, joihin se to- 
dellisuudessa ei pyri. Myös kritiikki, jossa esitetään kokonaan kielitajun 
käytöstä luopumista kielentutkimuksessa, kohtaa todellisia haasteita, 
sillä kielentutkija ei käytännössä voi välttää kielitajunsa käyttöä. 

Esittelemme tässä artikkelissa tutkijan kielitajun käyttöä kielitieteel- 
lisenä metodina sekä tieteenfilosofiselta että käytännölliseltä kannalta. 
Kohteeksi rajautuu pääasiassa tutkijan äidinkieli. Luvussa 2 esitämme 
ensin kielitajun tietoteoreettisen perustan ja sitten vertailemme ei- 
kielentutkijan ja kielentutkijan kielitajua. Luvussa 3 esittelemme kieli- 
tajulle läheisiä käsitteitä (ks. myös tietolaatikko 1). Luku 4 esittelee tii- 
viisti kielitajun käytön historiaa kielentutkimuksessa ja kokoaa siihen 
kohdistettua kritiikkiä. Luvussa 5 havainnollistamme kielitajun käyttöä 
käytännössä erikseen huomioitavien seikkojen ja esimerkkitapauksen 
valossa. Luku 6 on yhteenveto. 


2. Mitä on kielitaju? 


2.1. Mikä on kielitajun tiedollinen perusta? 


Kielitaju kohdistuu siis kieltä koskeviin tietoihin ja taitoihin. Kysyttäes- 
sä, mitä tällaiset tiedot ja taidot ovat tai voivat olla, nousee luonnostaan 
tarkasteltavaksi myös kysymys, miten tällaiset asiat periaatteessa tiede- 
tään tai miten niihin on kielenkäyttäjällä pääsy (ks. luku 2.2.). Edellytys 
kielitajun täysipainoiselle käytölle on äidinkielisyys tai muulla tavoin 
hankittu ensikielen tasoinen kielitaito (Karlsson 1998, 287). Usein tar- 
koitetaan äidinkielensä rakenteelliset perusteet jo oppinutta puhujaa.+ 
Tämän edellytyksen täyttyessä kielenpuhuja P voi todeta, että esimerkki 
(tb) on suomea ja esimerkit (ra) ja (1c) eivät ole.5 P on saattanut kuulla 
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jossain lausuman (1a). Hän kykenee sen palauttamaan mieleensä, on 
kielitajunsa varassa varma siitä, ettei kyse ole suomesta, mutta ei vi- 
roa taitamattomana tiedä, mitä se tarkoittaa. Viroa osaavana P voi olla 
myös toisella tapaa vakuuttunut, että kyseessä ei ole suomi, ts. koska 
hän tietää (1a):n olevan viroa. Esimerkki (1a) voi muistuttaa P:n mie- 
lessä esimerkkiä (1b). Tässä suhteessa vieläkin riidattomampi suomen- 
mukaisuus lienee esimerkki (1d), joka edustaa ns. selvää tapausta (engl. 
clear case, ks. Karlsson 1998, 287; Itkonen 2003, 34). Vastaavasti (1c) ei 
selvästi ole suomea. 


(ra) Kas sa oled täna heas tujus? ’Oletko tänään hyvällä tuulella?” 
[viroa] 

(tb) Kas, sä olet tänään hyväs tujus. 'Kas vain, oletpa tänään tuke- 
vassa humalassa. [puhekielinen ilmaus] 

(ic) *Koskantti, sokäntti koletontti tonoonkäntti hovaskyntti tojos- 
kuntti [kontinkieli, leikkikieli] 

(td) Naapuri on tukevassa humalassa. 


Esimerkeillä (1a—d) voidaan rajata summittaisesti niitä tiedonaloja, joi- 
hin kielitajua voidaan pätevästi soveltaa. Kuviossa 1 kielitajun kannalta 
selkeimmät alueet ovat p ja ei-p (p ”käypä ilmaus’): Jälkimmäinen rajaa 
selvästi P:n kielitajun ulottumattomiin hänelle vieraat luonnolliset kie- 
let ja keinotekoiset hölynpöly- tai privaattikielet (vrt. sosiaalisesti rajatut 
leikki- ja koodikielet), joita P ei hallitse. Ala p on yleensä kielitajulle 
kielenkäytön kannalta selvemmin tarjolla kuin ala ei-p, joka ilmenee 


* Pot mahdollisesti p ~s, 
4, ar ea rand e 


Pd ^ " S ` 
ı g P (selvät yy 3 


Kuvio 1. Äidinkieltä koskevan kielellisen tiedon loogisia aloja. (P:n mielestä p, 
missä p = "käypä ilmaus eli jokin ilmaus on esim. suomea tai jokin ilmiö koskee 
esim. suomen kieltä”. Huom. Alueiden koot ja suhteet viitteellisiä.) 
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tyypillisesti metakielellisissä pohdinnoissa ("onko oikein tai kielen- 
mukaista sanoa näin?”). Luvussa 2.2. käsittelemme tarkemmin käypiä il- 
mauksia. Luvussa 4.1. käsittelemme esimerkkejä kielitajun raja-alueesta 
sisällyttäen mukaan kielitajun kannalta vaikeasti tai ei ollenkaan tavoi- 
tettavia ilmauksia. 

Kun tarkastellaan sitä, millaisia kielellisiä ilmiöitä P:n kielitajulle 
luultavimmin selvinä tapauksina näyttäytyvät asiat ovat, voidaan esit- 
tää muun muassa esimerkkien (2) ja (3) tapaisia seikkoja. Ne koskevat 
kaikki jollain tavoin kielen käyttöä. Esimerkit koskevat eräitä suomen 


normeja. 


(2a) ”/p/ lausutaan tietyn artikulatorisen variaation sallimissa 
rajoissa [p] sanassa palo” [/p/ foneemi ja [p] sen toteutuma 
äänteenä] 

(2b) tyrsky vs. *tysrky 

(2c) talo+on vs. *on+talo [talo-1NE] tai korpi : korve+n vs. *korpi+n 
[korpi-GEN] 

(2d) sen naapurin kivat pikku kekkerit vs. *naapurin pikku se kivoja 
kekkerit 

(3a) [P,: Huomenta!] P: Huomenta vaan! vs. P : *Alasti tietysti! 

(3b) Minulla oli joskus pikku mopo. Ja se oli mielenkiintoinen 
vempain. 

(3c) Naapuri on taas ”ihan vain pienissä”. [lainausmerkeissä oleva 
jakso ironisesti] 


Esimerkki (2a) koskee fonologiaa ja foneemin toteutumista äänteenä. 
Foneettisen variaation rajoissa /p/:n toteutumat kyseisessä foneettisessa 
kontekstissa antavat äännejakson [palo], joka on tulkittavissa esimer- 
kiksi sanaksi palo ’palo’ (esim. maastopalo, palokunta, vrt. Palo Alto). 
Tulkinta koskee semantiikkaa. Esimerkki (2b) koskee fonotaksia eli 
äänteiden lineaarista järjestystä: jono rs on suomessa mahdollinen, *sr 
ei ole missään kontekstissa yhdistämättömissä sanoissa (vrt. hiusraja). 
Esimerkki (2c) havainnollistaa morfologiaa: ensimmäinen morfotaksia 
eli morfeemien järjestystä ja jälkimmäinen morfofonologiaa eli morfee- 
mien yhdistämisestä aiheutuvia fonologisia muutoksia (tässä suomen 
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astevaihtelua sanaa taivutettaessa). Esimerkki (2d) koskee syntaksia eli 
sanojen keskinäistä yhdistämistä (sanojen järjestystä ja kongruenssia). 

Esimerkit (2a-d) koskevat pääsääntöisesti kielen rakennetta tai muo- 
toa (ks. myös Karlsson 1982a, 18—28). Kielitajulla tavoitetaan kuitenkin 
myös erilaisia merkitykseen ja kielen käyttöön kuuluvia seikkoja. Esi- 
merkki (3a) koskee vuorovaikuttamista: vuoroparin jälkijäsen voi, vuoro- 
vaikutuksen mielekkyyden säilyessä, vaihdella vain tietyssä määrin. 
Vuoropareja ovat keskustelun rutiineista esimerkiksi tervehdys-tervehdys 
ja kysymys-vastaus-parit (ks. Keskustelunanalyysi ja vuorovaikutusling- 
vistiikka tk.). Esimerkki (3b) liittyy käynnissä olevan tekstin topiikin tun- 
nistettavaksi tekemiseen ja siihen viittaamiseen sopivalla pronominilla. 


Esimerkki (3c) havainnollistaa kykyä tulkita esimerkiksi toisen puheesta 
viestinnällisiä epäsananmukaisuuksia tai muodostaa sellaisia itse. 
Kuten esimerkeistä (2) ja (3) havaitaan, kielitajun kohteita voi olla 
periaatteessa kaikilta kielenkuvauksen perinteisiltä kuvaustasoilta aina 
äänne- ja muoto-opista pragmatiikkaan asti. On tärkeää korostaa muuta- 
mia asioita. Fnsiksi vaikka edellä esitetyt ilmiöt kuvaavat erilaisia kieltä 
koskevia yksittäisseikkoja, niistä ei kielenpuhujalle muodostu irrallista 
faktojen listaa. Sen sijaan monet yksittäiset tiedot linkittyvät toisiinsa 
muodostaen kieliopin järjestelmän tai osajärjestelmiä. Fi ole ylipäätään 
selvää, kuinka paljon erilaisia normatiivisia yksittäisseikkoja kielenpuhu- 
ja hallitsee tai tiedostaa, mutta perinteiset kielioppien kokonaiskuvauk- 
set ovat tässä suhteessa ainakin suuntaa antavia. Esimerkiksi (2a):ssa 
p-äänteen erilaiset artikulatoriset mahdollisuudet, eli miten p:n voi ään- 
tää, rajautuvat muihin äänteisiin (esim. valo, talo), ja tämän varaan raken- 
tuu viimein tieto suomen koko äännejärjestelmästä. Samoin esimerkki 
(2c) ei havainnollista vain talo-sanan yksikön illatiivin muodostusta tai 
vain korpi-sanan astevaihtelua, vaan erilaiset taivutuksen periaatteet kos- 
kevat samalla tavoin kaikkia vastaavanlaisia nomineja kaikissa sijoissa. 
Toiseksi tiettyjen ei-kielenmukaisuuksien tuottaminen on kielen 
oppimisen jälkeen sekä eriasteista että epätodennäköisempää kuin 
toisten. Esimerkiksi korpi-sanan yksikön genetiivi on kielitajussa mitä 
todennäköisimmin korven, ei *korpin (2c). Vastaavasti taas jokin ter- 
vehdykseen vastaaminen (3a) voi tapahtua huomattavasti vapaammissa 
rajoissa (esim. 3a; P|: Katohan, Keijo ~ kädenheilautus tai muu ele ~ 
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ei reagointia). Tämä johtuu siitä, että esimerkiksi monet muoto-opin 
ilmiöt ovat rajatumpia kuin pragmatiikan ilmiöt. Esimerkiksi jokin 
taivutustyyppi voi koskea jotain lueteltavaa sanajoukkoa. Normeilla on 
eri luonne kielen eri tasoilla. 

Kolmantena ja tärkeimpänä huomiona voidaan todeta, että arkisessa 
kielenkäytössä kielitaju toimii sekä yksittäisissä kielenkäyttötilanteissa 
(online-introspektio) että käytöstä irrallisena kognitiivisena kykynä (offline- 
introspektio) (Talmy 2007a; 2007b; ks. luku 5.2.). Perinteisesti kielitajua 
on tutkimuksessa sovellettu ja se on myös ymmärretty jälkimmäisellä 
tavalla. 


2.2. Kielitajun varaisen tietämisen perusteita ei- 
kielentutkijalla ja kielentutkijalla 


Kielitaju on kielen oppimisen ja kulttuuriin sosiaalistumisen seuraus. 
Ihmisillä oman ja toisten kielen erilaista monitorointia tapahtuu kielen- 
käyttötilanteissa ja niistä irrallaan kaiken aikaa. Kielenpuhujan ja kielen- 
tutkijan välillä on tässä suhteessa kuitenkin havaittavia motivaatio-, tie- 
dostumis-, tavoite- ja muita laadullisia eroja. Ensinnä kielenpuhujan 
motivaatiosuhde kieleen on samankaltainen kuin sekä kaivajan suhde 
lapioon että taiteilijan suhde pensseliin: kieltä käytetään; se on käyttö- 
väline maailmassa ja sen avulla toimitaan erilaisissa vuorovaikutus- 
tilanteissa. Samoin kielen monitoroinnin tavoitteet koskevat pääosin 
sitä, miten erilaisissa tilanteissa selvitään kielellisesti, miten keskinäi- 
nen (epä)ymmärrys ratkaistaan, miten ihmissuhteita ylläpidetään jne. 
Toiseksi omaan ja toisten kieleen sekä kanssakäymiseen kohdistuu 
erilaisia tunteita ja suhtautumistapoja, mikä ilmenee esimerkiksi kieli- 
vitseissä, murrematkimuksissa ja oikeakielisyyskeskusteluissa. Käytöstä 
irrallista itsehavainnointiin perustuvaa monitorointia tapahtuu kaikilla, 
ja esimerkiksi koulujärjestelmän kieltä yleisesti ja (vieraita) kieliä eri- 
tyisesti koskeva opetus myös kehittää tällaisen kyvyn harjoittamista.7 
Kouluopetuksen kieleen kohdistama huomio on jo tiedeperustaista. 
On ehkä mahdotonta todentaa täysin varmasti, millainen on kielen- 
puhujan keskimääräinen kielitaju (ks. Dabrowska 2010), mutta 
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Wittgensteinin teos Varmuudesta (1999 [1969]) tarjoaa uskottavia filo- 
sofisia lähtökohtia kielitajun ymmärtämisen perustaksi: 


Kummallista tässä on se, että vaikka olen aivan varma sanojen [kie- 
len] käytöstä, vaikka minulla ei ole siitä mitään epäilyä, en silti voi 
ilmoittaa menettelytavalleni mitään perusteita. Jos yrittäisin, voisin 
esittää 1000 perustetta, mutta en yhtään perustetta, joka olisi yhtä 
varma kuin se, mitä perusteiden on juuri määrä perustella. ($ 307) 

[- -]. He [ihmiset] ovat oppineet aina kokemuksesta ja heidän 
toimistaan voidaan nähdä, että he uskoivat varmasti tiettyjä asioita 
[esim. kieltä koskien], lausuivat he tämän uskon tai eivät. Tällä en 
tietenkään halua sanoa, että ihmisten pitää toimia näin, ainoas- 
taan, että he toimivat näin. ({ 284) 


Triviaalistaen ja kieleen soveltaen Wittgensteinin ajatusta kielenpuhujan 
itsetiedostavasta kielenkäytöstä voi havainnollistaa seuraavilla esimer- 
keillä (Wittgenstein 1999 [1969], $ 28): 


. tapahtuu 


talo-sanan yksikön illatiivi 


(4) Tämä NÄIN aion [Vrt. 2c] 


taivutetaan 


(5) Tapahtuu niin, että tämä, tulee tätä, ennen tässä 
[vrt. 2b] 


sanassa tyrsky" 


Kieli on käyttöä (mt. $ 110, 204, 229), ja tapahtumiskuvaukset (4) ja 
(5) koskevat varmuuden kyllästäminä kielenpuhujan mielessä kaikkia 
yksittäisiä selviä tapauksia.’ Näitä koskeva varmuus tai vakuuttunei- 
suus on pääosin piilevää — niiden perusteita ei yleensä esitetä —, ikään 
kuin kaiken kokonaisvaltaisen toiminnan perustana ja taustalla oleva 
episteeminen asenne, jota voi kutsua myös intuitioksi (ks. Raami 2015, 
21—23; Chudnoff 2013; Koksvik 2011). Tavallisen kielenpuhujan (ei- 
kielentutkijan) vakuuttuneisuus on suoraan nähtävissä itse kielellises- 
tä toiminnasta ja käytännöstä (Wittgenstein 1999 [1969], § 174, 395). 
Toiminnan taustalla oleva perusta tai esitieto lienee valtaosin intuitiivi- 
sena kielentämätöntä ja ei-propositionaalista eli ei-lausemuotoista. Se 
vain ilmenee — Wittgensteinin sanoin — niin ja niin toimimisena. Tätä 
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voidaan intro- ja retrospektiivisesti saattaa propositionaaliseen muotoon 
tarkasteltavaksi (esim. 4 ja 5). 

Edellä esitettyjä kieltä koskevia varmoja tapauksia edustavat kuvauk- 
set (4) ja (5) ovat naiivia kielitajun eksplikointia ja itse käytännöstä ir- 
rotettua ja etäännytettyä toimintaan kohdistuvaa objektivoivaa ajatte- 
lua. Itkonen (1974, 76) on kutsunut tämänkaltaisia propositionaalisia 
kuvauksia esiteoreettisiksi (ateoreettisiksi) sääntölauseiksi. Kielitajun var- 
muus arkisen kielellisen toiminnan taustalla ilmenee kuitenkin monina 
muina epäsuorina seikkoina: Emme epäile varmoja tapauksia (esim. 4: 
”Tapahtuuko tämä tosiaan näin? Onko näin aina tapahtunut?”), tuskin 
erehdymme niissä ja erehtymisen mahdollisuus ei tavallisesti edes nou- 
se mieleemme (Wittgenstein 1999 [1969], § 38, 83, 155). Uudet ulkoiset 
havainnot tai löydökset varmoina pitämistämme asioista eivät tee mei- 
tä entistä vakuuttuneemmiksi niistä tai siitä, mitä erehtyminen voisi 
ylipäätään näissä tapauksissa olla (ks. mt. § 307). Lisäksi emme pidä 
varmuuden esiteoreettista muotoilua hypoteesina eikä siihen päädytä 
erillisen tutkimuksen avulla (mt. § 55, 77). Toimimisen edellytys ylipää- 
tään on, että joitain asioita ei ollenkaan edes epäillä. 

Kielenpuhuja siis tietää kielestä paljon (intuition fenomenologiasta 
yleisesti ks. Koksvik 2017). Tätä voi pitää tietämisenä ennen muuta 
tietää-verbin etymologisessa merkityksessä ("tuntea tie, seurata jälkiä 
tai uraa’), ts. kielenpuhuja tavallisesti vain toimii niin ja niin, intuitii- 
visesti. Vain erityisissä käytännön tilanteissa (esimerkiksi taivutetaan- 
ko viiveen vai viipeen, jonkun nimen muistaminen, suostuttelutilanne 
jne.) kieltä koskevaan tietoon tai kielelliseen käytäntöön kohdistetaan 
itsehavainnoivaa huomiota (ks. luku 5.2.). Myös äidinkielisen kielen- 
tutkijan kieltä koskevan kielitajun perusta lepää edellä kuvatussa var- 
muudessa. Sekin on tavallisen kielenpuhujan kielitajua. Kuitenkin 
kielitaju on välineenä selvästi tiedostettu ja erikseen harjoitettu metodi 
osana kielentutkimusta ja sen teoreettista perinnettä. Metodilla pyri- 
tään tieteelliseen kuvaukseen osasta kieltä menetelmällä, jota käsite- 
analyysin yhtenä tyyppinä voi kuvata eksplikaationa eli käsitteellistettä- 
vien asioiden yhä selvempänä ilmaisemisena (Itkonen 1978, 301-310; 
ks. Käsiteanalyysi kielentutkimuksessa tk.; Tieteen termipankki sv. 


eksplikaatio). 
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Kielenpuhujan tiedostamista esiteoreettisista säännöistä lingvistin 
kielitajun kuvaus eroaa ensiksi selvimmin teoreettisen käsitteistönsä 
vuoksi. Esimerkissä (6) muut paitsi kielenainesta merkitsevät sanat ovat 
teoreettisia käsitteitä, mikä etäännyttää tällaisia kuvauksia jo merkittä- 
västi kielenpuhujan huomioista (vrt. esim. 4 ja 5). Näin kielentutkijan 
esitykset kiinnittyvät kielioppikuvauksen teoreettiseen perinteeseen. 
Esimerkki (6) on teoreettinen sääntökuvaus. Termit lekseemi, yksikkö ja 
illatiivi ovat teoreettisia käsitteitä, verbi taipuu kuvaa teoreettisesti ku- 
vattavaa operaatiota (sanan ilmiasun muuttumista), ja suomi konstituoi 
yhtenäisen kielen, jonka säännön esitetään kattavan. Tällaiset sääntö- 
kuvaukset voidaan laatia lukuisilla eri tavoilla, ja esimerkiksi erilaiset 
kielioppiteoriat ja -formalismit ovat tästä kuvaava osoitus (ks. Kieliopin 
tutkimus ja kielioppiteoriat tk.). 


(6) Suomessa lekseemi talo taipuu yksikön illatiivissa taloon. [vrt. 
2c, 4] 


Toinen ei-kielentutkijan ajattelusta selvästi eroava seikka on se, että 
kielentutkimuksessa teoreettisen kuvauksen motivaationa on usein 
koota esimerkin (6) tapaisia sääntöjä yhtenäiseksi ja systemaattiseksi 
kieliopin järjestelmän esitykseksi tai kuvata yksittäisiä sääntöjä jon- 
kin (osa)järjestelmän valossa. Kolmas seikka koskee tutkijan positiota, 
joka on tutkimuskohdetta aina jossain määrin olioiva: toisin kuin ei- 
kielentutkijalla tutkijalla on erityinen havainnoiva suhde kielen käytän- 
töön ja käyttöinstansseihin yleistämistä ja sen kuvaamista ajatellen. Nel- 
jäntenä seikkana voi mainita tutkijan tietoisuuden siitä, että kielitajulla 
voi operoida vain oman tietoisuuden piirissä ja että se kohdentuu viime 
kädessä yksilömurteeseen (idiolektiin). Tämä koskee kielitajun kontrol- 
lointia ja sen rajoitteiden tiedostamista metodina. 

Kielitajun mukaista kieltä voi tutkia myös käyttämällä kolmannen 
henkilön eli kielenoppaan kielitajua kyselymenetelmillä tai elisi- 


taatiolla (ks. Kysely; Kielten dokumentointi ja kieliopin kuvaus tk.). 
Tämä on luonnollista silloin, kun tutkijan oma kielitaju ei tunnu 
metodisesti enää riittävän ja kun halutaan erityisesti tietoa muiden 
kielitajusta. 
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Herää helposti kysymys, kuinka paljon esimerkkien (2—6) tapaisia 
selviä tapauksia on. Arvellen selviä tapauksia on yksilöitävissä tuhan- 
sia, tai jos huomioidaan sanojen merkitys, niin kymmeniä tuhansia. 
Paljon riippuu itse sääntökuvauksenkin tarkkuudesta ja abstraktio- 
tasosta. Kielentutkimuksen kannalta nousee myös kysymys siitä, mi- 
ten tarkan kuvauksen voi vielä ylipäätään olettaa vastaavan varmuutta 
tietoisella tasolla.? Esimerkkeinä sääntökokoelman systematisaatioista 
eli kielioppikuvauksista, joissa metodina on käytetty kielitajua, edusta- 
vat suomen osalta esimerkiksi morfo(fono)logiassa Karlsson (1982b) ja 
syntaksissa Hakulinen ja Karlsson (1995 [1979]). 

Vielä on tarkennettava selvien tapausten varmuuden lähdettä. Kieli- 
taju rajautuu niin ei-kielentutkijalla kuin kielentutkijallakin omaan 
mieleen, ja koettu varmuus on aina viime kädessä subjektiivista. 
Wittgenstein (1999 [1969], $ 284, 487, 634) esittää, että kielenpuhuja ei 
kykene tarjoamaan loogisesti riippumatonta perustetta varmuudelleen, 
josta hàn voi kuitenkin subjektiivisessa erehtymáttómyyden tunteessaan 
tiedostua. Selvät tapaukset kielessä ja niiden muodostama kokonaisuus 
vain on, tai paremminkin niin ja niin vain perustavasti tapahtuu, kun 
kieltä tulee käyttäneeksi. Kielentutkimuksessa tätä perustaa pyritään 
saattamaan teoreettiseksi kuvaukseksi. 

Taustalla ovat säännöt, normit ja konventiot (”näin pitää toimia”), jot- 
ka ovat yliyksilöllisiä eli sosiaalisia, kieliyhteisön kaikkien jäsenien tai 
ainakin enemmistön kesken pääosin jaettuja (esim. Itkonen 2003, luku 
19). Kielenpuhujan varmuuden takaavat siis normit, jotka vallitsevat, 
kohdistavat velvoittavuutta yksilön toimintaan tämän ehkä huomaamat- 
ta ja tarpeen vaatiessa käyvät epäsuorasti ilmi, mikäli normista livetään 
liiaksi. Keskeisin kollektiivisesti jaetun kielellisen normin peruste on 
ns. yksityiskieli-argumentti (engl. private language argument, ks. Itko- 
nen 2003, luku 21). Yksilö ei voi kaikessa vakuuttuneisuudessaankaan 
tukeutua kieleen, jota vain hän yksin ymmärtää. Jo jokin esimerkin (1c) 
tapainen kielenkäyttö johtaa helposti ymmärtämättömyyteen, mikäli 
ympäristö ei osaa, tunne tai tunnista leikkikielen koodia (vrt. kuviossa 
1 alue ei-p). 

Vastaavasti kielentutkijan tiedollinen peruste kielitajunsa käytölle on, 
että selvät tapaukset ovat normatiivisia. Kielitaju on yhtä subjektiivinen 
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kuin ei-kielentutkijalla ja metodina periaatteessa toistamaton (replikoi- 
maton) siinä mielessä, että se ei ole ilmipantava ja selvästi ositettavis- 
sa oleva proseduuri, jonka voi mallin mukaan toistaa. Sen sijaan sen 
pätevyys mittautetaan saattamalla kielitajulla saatu kielenaines ja sen 
varassa tehdyt teoreettiset päätelmät ja esitykset muiden kielentutkijoi- 
den arvioitavaksi. Jossain määrin tätä tekevät tavalliset kielenpuhujatkin, 
mutta kielentutkimuksessa se on olennainen osa itse metodin käyttöä. 


3. Terminologiasta ja lähikäsitteistä 


Kuten on jo käynyt ilmi, kielitajua koskevia tai sitä lähellä olevia käsit- 
teitä on lukuisia, ja aina terminologisia eroja ei tehdä riittävän selviksi 
(ks. tietolaatikko 1). Tässä luvussa selostetaan näitä eri käsitteiden yhte- 
neväisyyksiä ja eroja. 

Termillä introspektio (lat. intröspectus < intröspicere "katsoa, kurkistaa 
sisään”, kuv. luoda tutkiva katse’) tarkoitetaan yleisesti ensimmäisen 
persoonan tietoisen mielen subjektiivisten tajunnansisältöjen tarkas- 
telua ja arviointia. Tajunnansisällöt voivat olla esimerkiksi tunnetiloja, 
muistoja, mentaalisia prosesseja tai propositionaalisia tietosisáltójà.'? 
Näin introspektio voi olla sekä passiivista (kokevaa) että aktiivista (tietoi- 
sesti kohdistuvaa). Kielitieteessä termillä on myös hieman toisenlainen 
käyttö: sillä tarkoitetaan kielellisten ilmausten arviointia mm. niiden 
hyväksyttävyyden tai merkityksen kannalta. 

Tieteen termipankin antamat määritelmät introspektiolle vaihtelevat 
nekin tieteenaloittain. Kielitieteellisen määritelmän mukaan introspek- 
tio tarkoittaa sitä, että ”tutkija nojaa omaan kielitaitoonsa ja arviointi- 
kykyynsä tutkiessaan kieltä” (Kielitiede — itsehavainnointi | introspektio, 
ks. myös Karlsson 1998, 21). Filosofinen määritelmä taas kuuluu seuraa- 
vasti: ”oman tietoisuuden sisältöjen, tilojen ja rakenteiden havainnointi” 
(Filosofia > introspektio). Filosofisessa määritelmässä havainnoinnilla 
tarkoitetaan nimenomaan itsereflektiota eli havainnoijan oman tietoi- 
suuden kohdistamista havainnoijan omiin tajunnansisältöihin. Tällöin 
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havainnointitapahtuma ja sen osat sijoittuvat kokonaisuudessaan tietoi- 
suuteen eli arkisesti ilmaisten ”pään sisään”. Tämä on syytä pitää erossa 
aisteilla saaduista havainnoista, joiden kohteet sijaitsevat tyypillisesti 
havaitsijan kognition ulkopuolella, aistittavassa (ulko) maailmassa. 

Toisinaan introspektiolla siis tarkoitetaan kielentutkimuksen metodina 
itsehavainnointia, jolla tutkija kykenee tietoisesti tekemään selkoa äidin- 
kielekseen sisäistämänsä kielijärjestelmän normistosta ja kielenkäyttöä 
koskevista konventioista. On ehkä syytä erikseen korostaa, että normis- 
tolla ja konventioilla ei tässä tarkoiteta kielenohjailua ja kielenhuoltoa ja 
sen kohteena olevaa yleiskieltä vaan kielenkäyttäjän sisäistä tietoa, joka 
voi koskea yhtä hyvin normittamatonta kielimuotoa, kuten murretta tai 
sosiolektia. 

Intuitiolle (lat. intuitio 'näkemys' < intueri 'katsoa, pitää jonakin’) on 
annettu myös hieman eri merkityksiä eri vahvuusasteina. Yhden tulkin- 
nan mukaan se on välitöntä non-propositionaalista varmuutta, että pitää 
olla (esim. korven) tai ei pidä olla (esim. *korpin kuten 2c:ssä) (Rorty 
1967, 204). Intuition voi ajatella kontrolloimattomaksi ja esitietoiseksi 
tasoksi varmuutta, ja vain introspektiolla tämä voidaan saattaa (a)teoreet- 
tisina kuvauksina ilmi. Suhteessa metodiin introspektio on ”varmuuden 
jälkeisenä” ja sikäli retrospektiivisenä tavallaan metodisempi kuin sitä 
perustavampi intuitio. (Ks. Devitt 2006, 491; Raami 2015.) 

Kuten todettua kielitajulla tarkoitetaan tiedostettua ja tiedostamatonta 
omaa äidinkieltä koskevaa ymmärrystä (intuitiosta tietoisena päättelynä 
ks. Koksvik 2013). Se kattaa tavallisesti sekä intuition että introspektion, 
mikäli näiden käsitteiden kesken ei ole tehty eroa (vrt. tietolaatikko 1). 
Kielivaisto (myös kielikyky, kompetenssi) viittaa enemmän kielentämät- 
tömään intuitioon, jota voidaan saattaa tietoisen introspektion avulla 
joltain osin tietoisesti tarkasteltavaksi (ks. Karlsson 1998, 22). Kieli- 
taidolla tarkoitetaan tyypillisesti sekä oman kielen käytännöllistä kie- 
lenkäyttötaitoa että vieraiden kielten osaamista käytännössä. Kielitieto 
koskee hankittavissa olevia erilaisia formaaleja tietoja kielestä. Samoin 
kielen (ja kulttuurin) tuntemus on käytännön kielitaidon kerryttämää 
jotain kieltä ja kieliyhteisöä koskevaa kulttuurista tietämystä. Kielitietoi- 
suudella taas viitataan tavallisesti ideologiseen ja kielelliseen vallankäyt- 
töön ja vaikuttamiseen liittyviin ilmiöihin sekä laajasti kielen erilaisen 
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monimuotoisuuden tiedostamiseen yhteiskunnassa (monikielisyys, 
monilukutaito yms.) (ks. myös Piippo, Vaattovaara & Voutilainen 2016). 
Kielitietoisuuden käsitettä on sovellettu myös kansanlingvistiikassa tutkit- 
taessa kielenkäyttäjien kielitajua (esim. Preston 1996). Kielitieto, -taito, 
-tietoisuus ja kielen tuntemus ovat yleensä opetuksen ja koulutuksen 
myötä hankittavissa, ja kielentutkijan kielitajun tukena ne ovat usein 
hyödyksi. Esimerkiksi tieto jonkin yksittäiskielen yleisrakenteesta, ku- 
vausperinteestä ja muista teoreettisista taustoista on elimellinen osa 
tutkimusta, mutta ne ovat kuitenkin selvästi eri asia kuin kielitaju 
metodina. 

Toisinaan on osin leikkisästi ja osin perustellusti arvostellenkin käy- 
tetty kielitajusta metodina nimitystä nojatuolilingvistiikka ja kutsuttu 
esimerkiksi itse aineistoksi tuotettuja lauseita nojatuoli- tai laboratorio- 
lauseiksi (ks. Fillmore 1992, 35; Huumo 2007). Kritiikki on koskenut 
muun muassa sellaisia keksittyjä lause-esimerkkejä, joita ei löydy aidos- 
ta kielenkäytöstä mutta jotka periaatteessa ovat kielenmukaisia (ks. luku 
4.1.). Vähemmän perusteltua on ollut kritiikki, joka kieltää kokonaan 
kielen käyttöä koskevilla esimerkeillä operoimisen kielitajun varassa. 
Yleisemminkin puhutaan nojatuolifilosofoinnista tai -teoretisoinnista 
sellaisen tutkimuksen yhteydessä, jossa esimerkiksi ei kerätä ulkoista 
aineistoa tutkimuksen pohjaksi. Keskeisin lähde tällaiselle lisäepiteetille 
on se kritiikki, jota kielitajumetodin yksinomaista käyttöä kohtaan on 
esitetty kielentutkimuksen nk. empiirisen käänteen jälkeen (ks. luku 
4.2.). (Kielentutkimuksen käänteistä ks. Hamunen, Nieminen, Kelo- 
mäki & Dufva 2019.) 
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Tietolaatikko 1. Intuitio, introspektio vai kielitaju? 


Tutkijan oman kielitajun käyttöä lingvistisen analyysin metodina on kut- 
suttu vaihtelevasti introspektioksi ja intuitioksi. Itkonen ja Pajunen (2010, 
10-12) esittävät eron seuraavasti: 


e Introspektio: tietoinen prosessi, jonka kohteena ovat (yksilölliset) ko- 
kemukset tai tietoisuuden sisällöt, esimerkiksi mielikuvat ja tunnesävyt. 


e Intuitio: tiedonhankinta-akti, joka kohdistuu luonteeltaan sosiaaliseen 


normiin. 


Koska intuitio kohdistuu normiin, vain sen avulla kielentutkija voi ar- 
vioida, onko ilmaus korrekti vai epäkorrekti (*talo punainen tämä). Näin 
määriteltynä tässä artikkelissa käytetty termi kielitaju tarkoittaa siis sa- 
maa kuin kieltä koskeva intuitio. 


4. Kielitajun tutkimushistoriaa 


4.1. Kielitaju kielentutkimuksen historiassa 


Metodeja koskeva metateoreettinen tietoisuus on kielentutkimuksessa 
verraten nuorta. Tutkimusta koskeviin metodologisiin seikkoihin on 
kohdistettu eksplisiittistä huomiota vasta suhteellisen lyhyen aikaa, vaik- 
ka esimerkiksi länsimaisen kielentutkimuksen historia palaa monessa 
suhteessa antiikkiin asti (esim. Robins 1969 [1967], luku 1-2; Timofeeva 
2006). Kuitenkin perinteisissä kieliopeissa tapana on ollut rakentaa kie- 
len kuvaus joko kokonaan tai merkittäviltä osin kuvaajan itse keksimien 
esimerkkien eli kielitajun varaan. Esimerkiksi Apollonios Dyskoloksen 
teoksessa Syntaksista (Peri syntakseös) esimerkeistä noin neljännes on 
grammaatikon itsensä tuottamia lauseita. Loput on poimittu antiikin 
klassikoista, erityisesti Homerokselta. (Householder 1981, 5.) Apollonios 
myös ainakin kerran mainitsee, että joidenkin lauseiden virheellisyyttä 
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(esim. *grapso an ’aion kirjoittaa’) ei voi perustella muuten kuin ve- 
toamalla välittömään intuitioon (kr. antilépsis) (Apollonius 1981, 161)." 
Virheellisyyden tai epäkieliopillisuuden lajeja hän esittää kahta tyyppiä: 
syntaktisia virheitä (kr. soloikismos) ja sanakohtaisia artikulointivirheitä 
(kr. barbarismos) (Apollonius 1981, 7, 155-162). Edelliset vastaavat kieli- 
tajulla tavoitettavia luonnollisia normeja, jälkimmäiset preskriptiivisiä 
(oikeakielisyys)normeja. Yleisesti grammaattisilla kuvauksilla ohjattiin 
käyttämään kieltä oikein ja jonkin esteettisen mittapuun mukaan, esi- 
merkiksi hyvien kirjailijoiden tai sanankäyttäjien mallin mukaisesti. 

Intuitioon perustuvan kieliopillisuuden ja introspektiolla tuotetun 
kielenaineksen varassa argumentointi on (länsimaisen) kielioppitradi- 
tion ensiaskelista ollut osa kuvauksen käytännön metodiikkaa. Metodo- 
logia itsessään ei kuitenkaan pitkään aikaan noussut näkyviin. Tälle 
lienee lukuisia syitä: 1) erilaisia metodeja ei yksinkertaisesti ollut, ja 
olemassa olevaa käytäntöä — tekstilähteiden käyttöä ja kielitajua — ei tar- 
kasteltu metodologian kannalta; 2) kuvauksessa jouduttiin aluksi kes- 
kittymään peruskäsitteiden ja muiden kuvauskäytänteiden luomiseen; 
3) huomio kohdistui itse deskriptioon ja usein siihenkin, mitä kielen 
oletettiin paljastavan (esim. ajattelun universaalit kategoriat, ihmisen 
alkukieli, kansansielu tms.). 

Metodologiset huomiot yleisesti nousivat selvemmin esiin vasta 
1800-luvun jälkipuoliskolla nuorgrammaatikkojen historiallis-vertaile- 
vaa menetelmää kohtaan esittämästä kritiikistä, jonka keskiössä olivat 
muun muassa positivismin hengessä vaateet empiirisestä aineistosta, 
objektiivisuudesta ja muun muassa psykologismin ja kaikenlaisen kä- 
sitteellisen spekuloinnin välttämisestä (ks. Kelomäki 2014, 264; varhai- 
sesta anti-psykologismista ks. Kantor 1952 [1936], 46-56; Carroll 1955, 
71-82). Referenssitieteenä olivat luonnontieteet, ja jo yksinään tällöisiä 
metodologisia huomioita sinänsä voi pitää merkittävinä kielitiedettä mo- 
dernisoivina tekijöinä. Kuitenkaan psykologisointien välttämisen vuoksi 
kielitajua ei löydy nuorgrammatiikan metodologiasta. Kielentutkimuk- 
sen ja psykologian yleisestä suhteesta 1800- ja 1900-luvun molemmin 
puolin tarjoaa tiiviin yleiskuvan Kess (1983). 

Karkeasti yleistäen erityisesti kahdella tutkijalla oli keskeinen vai- 
kutus kielitajun esiinnousulle kielentutkimuksessa, Ferdinand de 
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Saussurella ja Noam Chomskylla. De Saussure esitti Yleisen kielitieteen 
kurssissaan (2014 [1916], 81-95) käsitteellisen jaon kielen järjestelmään 
ja puhuntaan (ransk. langue/parole). Lingvistiikan ensisijaisen kohteen 
hän siirsi järjestelmän hahmottamiseen. Tämä loi mahdollisuuden sille, 
että oli ylipäätään olemassa jokin käsitteellinen kielisysteemi, joka on 
omaksuttavissa, periaatteessa tutkittavissa ja erillään käytännön puhun- 
nasta. Historiallisen kielitieteen tutkimuskohde, kielenmuutokset, ei 
ollut periaatteessakaan kielitajulla tavoitettavissa. De Saussure kuitenkin 
sijoittaa kielijärjestelmän sosiaaliselle tasolle ja toteaa, että ”[k]ieli ei ole 
kielenpuhujan kyky, vaan tuote, jonka yksilö omaksuu passiivisesti” (de 
Saussure 2014 [1916], 88). Kieli on siis ensi sijassa sosiaalinen instituu- 
tio, ja sen yksilöllinen omaksuma on toissijainen. 

Kuitenkin de Saussure myös toteaa, että erilaisten kielen edellyttä- 
mien fysiologisten seikkojen ja elinten (puhe-elimet, artikulaatiorutiinit, 
aivot) ”yläpuolella” on yleisempi merkkien hallinnasta vastaava kielikyky 
(de Saussure 2014 [1916], 84). Tämä on tulkittavissa intuitioksi, vaikka 
de Saussure ei tätä termiä käytäkään. Myöskään introspektiota ei terminä 
mainita, mutta sen sijaan tehdään ero subjektiivisen ja objektiivisen ana- 
lyysin välillä (de Saussure 2014 [1916], 305). Edellinen tarkoittaa kielen- 
puhujien harjoittamaa kielen yksiköiden alinomaista analyysia, jälkim- 
mäinen diakronista tutkimusta. Selostus (de Saussure 2014 [1916], 
305—312) kielenpuhujan subjektiivisesta analyysista luo vaikutelman, 
että kyse on tavallisesta kielenpuhujasta ja tämän (online-)kielitajusta 
(ks. luku 5.2.). De Saussure ei esitä eksplisiittistä kielitajumetodia. 

Koska de Saussuren Kurssin perimmäinen tavoite oli asettaa yleisel- 
lä tasolla teoreettis-käsitteellinen perusta modernille (synkroniselle) 
kielentutkimukselle, siitä ei löydy metodista opastusta tai metodologiaa 
koskevaa tietoteoreettista pohdiskelua juuri edellä kuvattua enempää. 
Edellisen varaan syntyi kuitenkin useita strukturalistisia kielentutki- 
muksen suuntauksia (ks. esim. Helbig 1973, 342), joissa on eri tavoin 
otettu suoraan tai epäsuorasti kantaa kielitajuun. Karkean kolmijaon 
strukturalististen suuntausten ja tutkijoiden kesken voi tehdä episte- 
mologisten kannanottojen perusteella seuraavasti: 1) pelkästään kieli- 
järjestelmän kuvaukseen keskittyvät eli ei-kantaaottavat (platonistit), 2) 
anti-psykologiset (mekanistit) ja 3) kielitajun huomioivat (mentalistit). 
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Näistä kaksi jälkimmäistä ovat tässä huomionarvoisia. Bloomfieldin 
(1957 [1933], 32-41, 139-142) behaviorismiin pohjaava mekanistinen kä- 
sitys on tunnettu siitä, että sen mukaan kieltä tuli ensi sijassa tutkia käy- 
tössä ja vain havaittavan toiminnan tutkimiseen soveltuvin menetelmin 
ja että merkitykseen ei kielentutkimuksen silloisin menetelmin päästy 
käsiksi (vrt. Bloomfield 1983 [1914], luku 3; ks. myös Fries 1970, 203- 
217).? Käytännössä kuitenkin esimerkiksi Bloomfieldin (1957 [1933]) 
englantia kuvaavat esimerkit olivat kirjoittajansa kielitajun varaisia. 

Varsinaisia mentalisteja ei juurikaan ollut ennen Chomskya, mutta 
paikka paikoin tapaa pohdintaa kielitajun käytöstä metodina. Tesniére 
(1959, luku 18) esimerkiksi esittää, että kielitajua on vallitsevien mene- 
telmien vastaisena ja intuitioon nojaavana moitittu liian subjektiiviseksi. 
Hän toteaa kuitenkin seuraavaa: 


Tämä pelko on vielä helpommin kumottavissa. On totta, että 
introspektio [kielitaju] nojaa intuitioon. Mutta se nojaa myös sisäi- 
seen kokemukseen. Siksi se on kokemusperäinen [experimentale] 
menetelmä ja siten objektiivinen. (Mts. 38.) 

Introspektio [Kielitaju] on objektiivista myös siitä syystä, että se 
koskee tosiasioita [faits]. Nämä tosiasiat ovat toki abstrakteja. Mutta 
ei ole olemassa pelkästään konkreettisia tosiasioita. Voidaan jopa 
sanoa, että syntaksissa kaikki tosiasiat ovat abstrakteja, koska lop- 
pujen lopuksi ainoastaan niiden merkitsin [marguant] on konkreet- 
tinen. On siis tuskin muuta menetelmää, jolla voidaan saavuttaa 
täysin abstraktit syntaksiin liittyvät tosiasiat kuin sisäinen analyysi. 


(Mp.) 


Silti Tesniére (mp.) myöntää, että kielitajua on käytettävä varoen: tut- 
kijan on oltava äidinkielinen tutkittavan kielen puhuja, kielitaju ei ole 
sisäsyntyistä vaan erikseen harjaannutettava taito, ja sitä voi soveltaa 
syntaksissa sanojen keskinäisiä suhteita tutkittaessa (esim. dependenssi). 

Myös jotkut varhaiset ei-strukturalistiset tutkijat saattoivat ottaa kan- 
taa kielitajun käyttöön ja olemassaoloon, vaikka heidän kiinnostuksensa 
kieltä kohtaan virisi yleensä nimenomaan kielen kontekstuaalisuuden ja 
käytön (parole) tutkimisesta. Esimerkiksi Gardiner (1951 [1932], 343-344) 
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esittää, että havaittavia maailman tapahtumia tehdään ymmärrettävik- 
si tietoisen järkeilyn ja introspektiivisen tiedon avulla. Yleisemmin 
ei-strukturalistit kuitenkin vieroksuivat yksinomaista kielitajun käyttöä, 
mikä juontui esimerkiksi (kieli)psykologian piirissä mentalismiin koh- 
distuneesta kritiikistä ja behaviorismin myötä erityisestä kiinnostuksesta 
kielelliseen käyttäytymiseen (ks. Carroll 1955, 75). Esimerkiksi John R. 
Firth (1957, 175-176, 179) pitää kieltä kaikkiaan kontekstuaalisena. Se 
ilmenee ja siihen on pääsy vain tekstien kautta. Siksi kielitaju ei ole 
riittävä metodi. 

Vielä Zellig Harris (1969 [1951], 12-13) piti amerikkalaisen struktura- 
lismin kielenkuvauksen kohteena kerätyn korpusmateriaalin analysoin- 
tia. Kuten todettua Chomsky (2001 [1965], 3-27) kuitenkin ohjelmalli- 
sesti siirsi kielentutkimuksen painopistettä voimakkaasti mentalismin 
puolelle. Generatiivinen kielioppi oli ensimmäinen kokonaisvaltainen 
synkroninen kielioppiteoria ja erään tulkinnan mukaan samalla myös 
ensimmäinen strukturalismin kognitiivinen versio ja väljässä merkityk- 
sessä kognitiivisen kielentutkimuksen aloittaja. 

Chomskylla on oma kielitajua sivuava terminologiansa. Hänen 
mukaansa kompetenssi on kielenpuhujan sisäistämää implisiittistä tie- 
toa (engl. intuition, tacit knowledge) kielestä ja erityisesti sen lauseista. 
Chomskyn ja hänen seuraajiensa mielenkiinto kohdistuikin ennen kaik- 
kea abstraktiin syntaksiin, joka ilmentää kompetenssia. Kompetenssiin 
ei tutkijalla kuitenkaan ole suoraa pääsyä, sillä sen perusta on choms- 
kylaisen ajattelun mukaan biologisperäisessä synnynnäisyydessä, joka 
on tietoisuuden alista. Vaikka yksilöstä tai ideaalista puhuja-kuulijasta 
siis tulikin biologisen kompetenssin kantaja, oli kielen lauseisiin silti 
suorin metodinen pääsy tutkijan oman kielitajun varassa. Performanssi 
sen sijaan on kieltä aidoissa käyttöyhteyksissään. Chomsky kuitenkin 
sivuutti sen siksi, että puheen erilaiset toistot, katkot, korjaukset, epä- 
röinnit ja muut häiriötekijät peittävät hänen mukaansa alleen kieliopin 
ja kompetenssin säännönmukaisuutta. (Chomsky 2001 [1965].) Silti 
kielitajuakin on pidettävä juuri yhtenä performanssin ilmentymänä. 

Generatiiviselle syntaksille on ollut erityisen leimallista tutkijan oman 
kielitajun varassa tuottaa erilaisia syntaksin abstrakteja, analyysilla esiin 
tuotavia ilmiöitä edustavia lause-esimerkkejä. Esimerkit (7a) ja (7b) 
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näyttävät pintarakenteeltaan samanlaisilta. Ne ovat kuitenkin syväraken- 
teeltaan erilaisia, sillä transitiivinen infinitiivitäydennys, jota muunnel- 
laan aktiivissa ja passiivissa, saa erilaisia tulkintoja englannin persuade- 
ja expect-verbeissä. Esimerkit (9a) ja (9b) ovat totuusarvoltaan samoja: 
mikäli (ga) on totta, myös (9b) on. Sama ei päde esimerkkeihin (8a) 
ja (8b); niiden totuusarvot eivät ole toisistaan riippuvaisia. Chomskyn 
mukaan kieliopin teoreettisen kuvauksen tulisi kohdistua nimenomaan 
tällaiseen kompetenssin piilevään tietoon. 


7a) I persuaded John to leave 

7b) I expected John to leave 

8a) I persuaded a specialist to examine John 

8b) I persuaded John to be examined by a specialist 

ga) I expected a specialist to examine John 

9b) I expected John to be examined by a specialist (Chomsky 2001 


[1965], 22). 


Syntaktisen tiedon abstraktistavan pinta- ja syvärakenteen eron li- 
säksi toinen merkittävä käsitepari Chomskylla (2001 [1965], 10-15) 
on ollut kieliopillisuus (engl. grammaticalness) ja hyväksyttävyys (engl. 
acceptability). Edellinen koskee kompetenssia, jälkimmäinen perfor- 
manssia. Esimerkki (10a) on kieliopillinen eli englannin kieliopin mu- 
kainen. Vastaavasti (10b) ei ole, sillä oikealle haarautuvissa rakenteissa 
relatiivipronomini korreloi yleensä välittömästi edeltävän sanan kanssa, 
ei rakenteiden yli. Esimerkin (10a) toistuva that-rakenne ilmentää kom- 
petenssin ja kieliopin kykyä tuottaa periaatteessa määrättömän pitkiä 
kieliopillisia rakenteita (rekursiivisuus eli toistettavuus). Tällaiset kielen 
ilmiöt ovat Chomskyn (2001 [1965], 15-16) mukaan todiste kielikyvyn 
rajaamattomuudesta. Vastaavasti molemmat esimerkit (11a) ja (11b) ovat 
kieliopillisia, mutta (11a) on käytössään hyväksyttävämpi kuin (11b). Se 
on luonnollisempi, helpommin ja nopeammin ymmärrettävissä sekä 
vähemmän kömpelö kuin (11b). Esimerkki (12) kuvaa erityisen ei-hyväk- 
syttävää mutta kieliopillista englannin lausetta. 
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(10a) This is the cat that caught the rat that stole the cheese 

(tob) * This is the cat, that caught the rat, that stole the cheese that, eat 
it. 

(11a) I called up the man who wrote the book that you told me about 

(11b) I called the man who wrote the book that you told me about up 

(12) the man who the boy who the students recognized pointed out is 
a friend of mine (Chomsky 2001[1965], 10-13). 


Dabrowska (1996) tutki äidinkielisten kielenpuhujien kykyä ymmärtää 
kieliopillisia mutta hyväksyttävyydeltään vaihtelevia englannin lauseita 
poimimalla generatiivisista tutkimuksista esimerkkien (13-15) kaltai- 
sia tapauksia arvioitavaksi. Tutkittavilta kysyttiin muun muassa, kuka 
kuvatussa tilanteessa tekee kelle ja mitä. Tulos oli puhutteleva: kyky 
ymmärtää lauseita korreloi vastaajien koulutustaustan kanssa, vaikka 
kielitajun takaisen kompetenssin pitäisi periaatteessa olla yhtäläinen 
kaikille kielenpuhujille (ks. myös Spencer 1973). Vastaajina oli muun 
muassa yliopiston siivoojia, lehtoreita ja opiskelijoita, joista kukaan ei 
ollut kielentutkija. Myös koulutetuille vastaajille lauseiden tulkitsemi- 
nen oli haastavaa, ei oletuksen mukaisesti automaattista. Kognitiivisten 
tulkintarutiinien puuttuessa tällaisten esimerkkien käyttäminen sinänsä 
uskottavista teoreettisista kieliopin ilmiöistä (esim. jonkin rakenteen 
toistuvuus) vetääkin helposti vesiperän. 

Esimerkit (13-15) asettuvat kuvion 1 (ks. luku 2.1.) alueelle mahdolli- 
sesti p. Ne ovat kieliopillisia, mutta koska niiden kaltaisia löytyy hyvin 
harvoin todellisesta kielenkäytöstä, joutuu vakavasti kysymään, mikä nii- 
den arvo on edes teoreettisintakaan kielikykyä ajatellen. Luottamus kieli- 
tajulla tuotettujen esimerkkien käyttöön on kokenut ehkä suurimman 
arvonalennuksensa juuri tällaisilla lauseilla operoinnin vuoksi. Tällai- 
sia lauseita on käytetty erittäin paljon kielitieteessä juuri generatiivisen 
teorian piirissä. Schitze (1996) on perusteellinen selonteko tällaisen 
metodologian teoreettisista hankaluuksista (ks. myös Wasow & Arnold 
2005, Chomskyn varhaisista metodologia-ajatuksista Karlsson 2008). 


(13) The manager knew that the fact that taking good care of herself 
was essential upset Alice. 
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(14) That dog will be difficult to persuade the little girl to play with. 
(15) John thought that the fact that criticizing himself was hard 
surprised Mary. 


Tämän jälkeen 1970-luvun kuluessa ja sen jälkeenkin erilaisia, aluksi 
erityisesti syntaksiin keskittyviä kielioppimalleja syntyi lukuisia. Näitä 
esittelevät tiiviisti muun muassa Moravcsik ja Wirth (1980) sekä Droste 
ja Joseph (1991). Kielitaju on ollut aina keskeinen kuvattavien kielen- 
ilmiöiden hankintatapa erilaisissa teoreettisissa kielenkuvausmalleissa. 
Myös monien nykyään olemassa olevien mallien perusta on alkuaan 
rakennettu kielitajulla tuotettujen esimerkkien varaan. Tämä näkyy 
joko käytetyistä esimerkeistä (esim. Langacker 1987) tai sekä esimer- 
keistä että eksplisiittisestä kielitajun asemoimisesta kielentutkimuksen 
metodologiassa (esim. Talmy 2003 [2000], 4-6). 


4.2. Kielitajulle esitettyjä rajoituksia ja kritiikkiä 


Kielitajun käyttöä on jonkin verran kritisoitu. Motivaationa on ollut eri- 
tyisesti generatiivisessa suuntauksessa vallinnut mentalismi, joka on il- 
mennyt muun muassa tutkijan oman kielitajun melkein yksinomaisena 
käyttönä. Edellä esittelimme jo Dabrowskan (1996) tutkimuksia yhtenä 
esimerkkinä kielitajun käytön kritiikistä. 

Myös toinen generatiivisen suuntauksen kritiikki juontuu metodista. 
Esitykset universaalikieliopista ovat nojanneet viime kädessä englannin- 
kielisten tutkijoiden oman kielitajunsa varassa muodostamiin esimerk- 
keihin. Tiedetään kuitenkin, että yhden kielen sisällä tietyn valikoi- 
tuneen ihmisryhmän (akateemiset kielentutkijat) kielitajun varaisen 
aineksen ei voi ajatella edustavan edes yhtä kieltä, saati koko ihmiskieltä. 
Lisäksi taustalla olevan kielitieteellisen teoretisoinnin voi jo nähdä vai- 
kuttavan ohjaavasti esimerkkityyppien sepittämiseenkin (esim. 13-15). 
Myös käyttäytymistieteellisessä tutkimuksessa tiedetään, että muun 
muassa havaintojen tekeminen (esim. kielestä) ja niiden selostaminen 
(esim. kielitajulla) on vahvasti kulttuuri-, koulutus- ja muihin tausta- 
tekijöihin sidoksissa (ks. Henrich, Heine & Norenzayan 2010). Näin 
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ollen käytettävän aineiston, sen yleistettävyyden ja selittämisen suhdetta 
tulee kielentutkimuksessakin tarkkaan pohtia metodista riippumatta. 

Kun erotetaan kielitajun kritiikistä erikseen nimenomaan generatii- 
visesta perinteestä motivoituva ja siihen kohdistuva kritiikki, voidaan 
esitetyt varaukset jakaa karkeasti kahtia 1) kielitajun yleistä olemusta 
koskeviin ja 2) kielitajun varassa saatavaa tietoa koskeviin. Ensiksi kieli- 
tajun olemusta koskevat samanlaiset ominaisuudet kuin kaikkea men- 
taalista toimintaa: siihen on viime kädessä pääsy vain yksilöllä itsellään. 
Se on solipsistista. Kielitajun tuotokset saatetaan kuitenkin tutkimuk- 
sessa kollektiivisesti arvioitaviksi osana lingvististä argumentaatiota. 
Lisäksi tyypilliset selvät tapaukset perustuvat yhteisiin sosiaalisiin nor- 
meihin, jotka tutkijakin on sisäistänyt kieliyhteisön jäsenenä ja joiden 
kielenmukaisuutta ei tavallisesti ole tarpeen erikseen oikeuttaa (esim. 
korpusaineistolla). Sama vasta-argumentointi käy myös väitteisiin siitä, 
että kielitaju koskisi aina vain yksilön idiolektia tai että kielitaju olisi 
aina epävarmaa ja vaihtelevaa. Selvissä tapauksissa näin ei ole. Epäsel- 
vissä tai rajatapauksissa asiaan saadaan yleensä selkoa vertailemalla eri 
puhujien kielitajuja sekä käyttämällä muita metodeja (esim. korpus- tai 
kyselytutkimus). 

Toinen kielitajun olemukseen liittyvä seikka on äidinkielisen puhujan 
vaatimus. Silti myös esimerkiksi vierasta kieltä tutkiva kenttälingvisti 
käyttää ko. kieltä koskevaa ja alati kehittyvää kielitajuaan osana analyysi- 
välineistöä. Tämä tapahtuu ainakin niin, että kielenmukaisuudet ero- 
tetaan epäkielenmukaisuuksista ja aidot aineistoesimerkit luokitellaan 
esimerkiksi kielioppikuvauksen kategorioiden mukaisesti. 

Niinpä vaikka kielitaju onkin yksilökohtainen ja yleensä vahvim- 
millaan äidinkielinen kyky, sillä tuotetut esimerkit kohdistuvat yleen- 
sä sosiaalisesti jaettuun ja ylipäätään jaettavissa olevaan tietoon, jon- 
ka varassa esitetyt väitteet asetetaan kriittisesti tarkasteltaviksi. Silti on 
tärkeää, että tutkija tiedostaa kielitajunsa tietyn yksilökohtaisuuden, 
joka ilmenee yleensä viimeistään kuvion 1 alueiden p ja mahdollisesti 
p rajankäyntinä (ks. luku 2.1.). Epävarmoissa tilanteissa on aina käy- 
tännöllistä hakea tukea muista aineistonhankintametodeista. Erillisen 
tutkimuksen aihe olisi selvittää, miten kielitaju toimii taustatekijänä 
tutkijalle vieraita kieliä tutkittaessa. 
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Toiseksi kielitajulla saatavaan tietoon liittyy erityisesti myös tarkei- 
tä metodiin itseensä kohdistuvia tutkimusaiheita. Toisin sanoen osan 
esitetystä kritiikistä tai varauksista voi kääntää aidoksi tutkimuskysy- 
mykseksi kielitajusta metodina. Yksi tällainen on varauksellisesti esitet- 
ty kysymys siitä, millainen on nk. selvien tapausten kaanon. Millainen 
kokonaisuus niistä mahdollisesti muodostuu? On selvää, että kielitajut 
eivät ole kaikkinensa identtiset yksilöiden kesken. Sen sijaan selvien 
tapausten osalta voi kysyä, tarkoitetaanko niillä selviä yksittäistapauksia 
(korven ’korpi-gen’ on suomea) vai tyyppitasolle abstrahoituja ja sellai- 
sina kuvattavia ilmiöitä (korven edustaa suomen i : e -nominien taivu- 
tustyyppiä).'t Edellisiä on paljon ja joskus määrättömästi (esim. lause- 
esimerkeille ei ole ylärajaa), jälkimmäinen on kiinteästi kytköksissä 
kuvauksen teoriaan. 

Toinen kysymys on kielitajuesimerkkien luonne aineistona. Esimer- 
kit ovat niin kiinteä osa jonkin ilmiön teoreettista kuvausta, että esimer- 
kiksi Lehmann (2004, 293—294) taipuu pitämään kielitajuesimerkistöä 
muuna kuin (aitona korpus)aineistona, jona hän pitää lähinnä empiiris- 
tä, havainnoitua dataa. Silti esimerkit ovat usein tarkoitukseensa käypiä, 
joten niiden episteemistä luonnetta ja asemaa on hyvä pohtia (ks. myös 
luku 5.1.). 

Kolmas kysymys on kielitajuesimerkkien tyypillinen kirjoitetun yleis- 
kielen mukaisuus. Tämä johtaa kysymään, koskeeko kielitaju aina vain 
kirjoitettua yleiskieltä, joka on lopulta melko rajattu ja keinotekoinen 
kielen varieteetti. Näin voi joskus olla. Silti kuvattu ilmiö saattaa olla 
niin laaja-alainenkin, että se koskee varmuudella koko kieltä (esim. suo- 
men sijat ovat suffikseja). Tällöin yleiskielinen kirjoitusmuoto toimii 
tavallaan vain havainnollistavana välineenä koko kieltä koskevan tyyppi- 
tason ilmiölle. 

Vaikka tutkimuksen paino olisikin kielitajun käytössä, voi olla var- 
muuden vuoksi hyvä kerätä ilmiötä havainnollistavia näytteitä myös kie- 
len muista, puhutuista tai kirjoitetuista muodoista. Yleisesti kirjoitettu 
esitystapa liittyy kielentutkimukselle laajemmin esitettyyn kritiikkiin 
kirjoitetun kielen harhasta tai skriptismistä (engl. written language hias, 
ks. Linell 2005; scriptism, ks. R. Harris 2009). Kritiikin keskiössä on 
se kehämäisyys, jolla puhuttu kieli saatetaan erilaisin kirjoitusmerkein 
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(grafeemit, litteraatiot, transkribointi yms.) symbolimuotoon ja näistä 
tehdyt päätelmät palautetaan kielen ominaisuuksiksi. Näin kielestä an- 
netaan kritiikin mukaan liian oliollistettu kuva. 

Kielitajua on kritisoitu myös siitä, että sillä ei voi kuvata teksti- tai 
keskustelutason ilmiöitä. Kuitenkin kielitajun varassa on pääsy moniin 
tämänkin tason seikkoihin (ks. luku 5.2.), joten päätelmä ei täysin pidä 
paikkaansa. Sen sijaan kielitajun käyttämättömyydelle tällä tasolla voi 
esittää muutaman perustelun. Ensinnä teksteihin ja puhuttuihin kielen 
muotoihin keskittyvä tutkimus pitää itse tärkeänä, että aineisto on koos- 
tettu aidosta kielenkäytöstä. Näissä suuntauksissa kielitajun varaisen 
esimerkistön käyttö kohtaa luultavasti kritiikkiä. Toiseksi puhutut ja kir- 
joitetut tekstit ilmenevät ja niitä myös pidetään kielenkäyttötapauksina, 
joiden sepittäminen kielitajun varassa olisi looginen virhe: tutkija sepit- 
täisi ensin teoreettista väittämäänsä vastaavan tekstin ja esittäisi sitten 
saman tekstin todellisena esimerkkitapauksena kielenkäytöstä. Tällai- 
sen välttäminen ei ole kielitajun rajallisuutta metodina vaan pikemmin 
asiaankuuluvaa pidättäytymistä argumentointivirheestä. 

Kuten minkä tahansa metodin myös kielitajun puutteita ja rajoitteita 
tulee avoimesti pohtia. Vähintään yhtä tärkeää olisi tutkia erilaisia me- 
todeja itseään ja esimerkiksi kielitajun luonnetta vieläkin tarkemmin, 
jotta ymmärrys tutkimuksen luonteesta tarkentuisi. Tällä tavoin yksit- 
täisten metodien käyttö ja keskinäinen yhdistely muodostuisivat yhä 
tarkoituksenmukaisemmaksi. On vielä todettava, että kielitaju on toimi- 
va metodi omalla vahvuusalueellaan. Se on myös välttämätön osa mitä 
tahansa kielentutkimusta tutkimushypoteesien muodostelussa (esim. 
naturalistisen observoinnin pohjalta), monien metodien esi- tai osatöinä 
(esim. kysely, kokeelliset menetelmät, elisitointi) sekä tulosten tulkin- 
nassa (ks. esim. Arppe 2008, 1-7). Kaikkein empiirisinkään tutkimus ei 
voi pidättyä kokonaan kielitajun käytöstä, koska esimerkiksi aineistoa ei 
voi kerätä ilman alustavaa käsitystä tutkittavasta ilmiöstä. 
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5. Kielitaju käytännössä 


Tutkijan kielitaju on tärkeä työkalu ja erottamaton osa kaikenlaista 
kielentutkimusta. Erityisen tärkeä se on silloin, kun tarkastellaan yk- 
sittäisten ilmausten merkityksiä. Tässä luvussa keskitymme tähän ja 
tarkastelemme kielitajun käyttöä sellaisessa kielentutkimuksessa, joka 
käyttää tutkimusaineistona joko pelkästään tai osittain tutkijan itsen- 
sä sepittämiä esimerkkejä. Luvussa 5.1. esittelemme kielitajun avulla 
hankitun aineiston luonnetta. Luvussa 5.2. selostamme Talmyn (20072) 
esitystä kielitajun kyvystä tavoittaa erilaisia kielen ilmiöitä. Luvussa 5.3. 
havainnollistamme esimerkkitapauksella kielitajun käyttöä aidossa 
tutkimuksessa. 


5.1. Data, evidenssi, teoria? 


Kielentutkimuksessa kielitaju on tietoista huomion kohdistamista eri- 
laisiin kielenpiirteisiin sellaisina, kuin ne ilmenevät tutkijan kognitiossa 
(Talmy 2007b, xii). Karlsson (2008, 14) erittelee menetelmän käyttöä 
tarkemmin siten, että siihen kuuluu yhtäältä ensi vaiheessa äidin- 
kielisen kielitajun konsultoiminen ylipäätään ja toisaalta täysin kieli- 
opillisten (selvien tapausten), epäkieliopillisten ja ei-yksiselitteisten tai 
kyseenalaisten lause-esimerkkien tuottaminen. Kielitajun ei tietenkään 
tarvitse rajoittua vain lauseisiin. On myös huomattava, että sillä tuotettu 
kielenaines ei ole ”kompetenssiaineistoa”, sillä abstraktiin chomskylai- 
seen kompetenssiin ei ole suoraa pääsyä (Penke & Rosenbach 2007, 14). 
Kielitaju ilmentää myös kielellistä performanssia. Näin tuotettu kielen- 
aines poikkeaa silti eräiltä osin merkittävästi tyypillisen empiirisen me- 
todin keinoin hankitusta aineistosta. Herääkin kysymys, missä määrin 
kielitajulla saatu aines poikkeaa tyypillisestä empiirisestä aineistosta ja 
mitä tieteenfilosofisia seuraamuksia tällä mahdollisesti on. 

Ensinnä on huomattava, että kielitajun tuottama kielenaines on reflek- 
siivistä, ikään kuin itsestään tietoista, ts. se ei olisi olemassa ilman käyt- 
tötarkoitustaan tutkijan itsensä esittämänä havaintoaineistona jostain 
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kieltä koskevasta seikasta. Tässä suhteessa tällainen kielenaines eroaa 
jyrkästi spontaanista ja autenttisesta kielenkäytöstä, joka usein erilaisin 
menetelmällisin keinoin erikseen saatetaan tutkimusaineistoksi (tallen- 
taminen, litterointi, kieliopillinen koodaus jne.). Tästä prosessista antaa 
valaisevan kuvan Lehmann (2004). Huomattakoon, että myös autent- 
tinen kielenaines on refleksiivistä mutta eri tavalla: tilanteisessa kielen- 
käytössä kielellisten valintojen tarkoituksenmukaisuutta arvioidaan ja 
tulkitaan vuorovaikutuksellisista lähtökohdista, osana meneillään olevan 
toiminnan mielekkyyttä ja rakentumisehtoja. Tällöinkin kielioppia moni- 
toroidaan mutta ei yleensä kielentutkimuksellisella motivaatiolla. 
Toiseksi ulkoinen aineisto koostuu esiintymistä (engl. token), kun taas 
kielitajulla tuotettu aines edustaa tyyppisyyttä (engl. type). Sillä ilmenne- 
tään yleensä jonkin kieliopillisen rakenteen tilanteisesta käytöstä riippu- 
matonta lingvististä ilmiötä yleistetyllä tyyppien tasolla. Kielitajun käyttö 
aineslähteenä onkin tyypillisesti kiinteä osa teoreettista kielenkuvausta. 
Konstenius (2014, 151) kuvaa kielitajun mukaisten esimerkkien luonnet- 
ta osuvasti: ”Teoreettisen kieliopin heuristiset esimerkit, joiden tarkoi- 
tus on osoittaa lukijalle kirjoittajan jokin tarkoite tai intuitio, toimittavat 
ostensiivista roolia. Johtopäätös ei perustu esimerkkiin. Esimerkkien 
tehtävä on vain osoittaa lukijalle kirjoittajan tarkoittamia rakenteita.” Sen 
sijaan tyypillinen korpusaineisto tai ulkoinen raakadata eli aineistoksi 
vielä muokkaamaton mutta tallennettava kielenaines ei sisällä tällaista 
episteemistä elementtiä. Kielitajun mukaiset esimerkit ovat tässä mie- 
lessä autonomisia silloinkin, kun niillä ilmennetään jotain kielenkäyt- 
töön ja kontekstiin liittyvää tyyppisyyttä. (Ks. myös Devitt 2006.) 
Kolmanneksi ja edellisen seurauksena kielitajulla ei voi tuottaa ai- 
neistoa, sitten tallentaa sitä ja tämän jälkeen tuoda sitä tutkittavaksi 
ikään kuin empiirisenä aineistona. Tällaiseen ei yleensä langetakaan, 
mutta kielitajulla tuotettujen tekstiesimerkkien osalta voi helposti he- 
rätä tällainen (joskus perusteeton) kritiikki. Kuitenkin voidaan tuottaa 
myös lausetta pidempiä (teksti)esimerkkeja esimerkiksi havainnollis- 
tettaessa erilaisia lauserajat ylittäviä ilmiöitä, kuten pronominien viit- 
tauskäytäntöjä (ks. esim. Larjavaara 2007, 482). Tätä tapahtuu piilevästi 
myös esimerkiksi silloin, kun irtolauseiden taustalle ajatellaan niiden 
potentiaalisia ja mahdollisia esiintymiskonteksteja. Tämä ei kuitenkaan 
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kielitajumetodin sisällä implikoi eikä siitä seuraa sitä, että tutkittaisiin 
todellista kielenkäyttöä. Kielitaju vain soveltuu joiltain osin myös teks- 
tuaalisiin ilmiöihin, sillä moniin tekstitason tyyppi-ilmiöihin pääsy on 
kielitajun varassa. Tuotettujen esimerkkien poikkeavuus ulkoisesta ai- 
neistosta saa Lehmannin (2004, 292) pitämään kielitajua lähinnä tut- 
kijan heuristisena työkaluna, joka jää empiirisen metodologian ulko- 
puolelle. Näin tuotetuilla esimerkeillä ei myöskään tällöin olisi aineiston 
asemaa tavanomaisten empiiristen metodien puitteissa. 


5.2. Leonard Talmyn online- ja offline-introspektio 


Kielitajua koskevien ilmiöiden yksityiskohtaisessa analyysissaan Talmy 
(2007a; 2007b) lähtee siitä, että (äidin)kieltä koskeva itsehavainnointi ei 
ole pelkästään lingvistiikan tutkimusmetodi vaan arkipäiväinen ja kaikil- 
le ihmisille yhteinen kyky ja taipumus, jota jokainen harjoittaa jatkuvasti 
monella eri tavalla.5 Tätä kykyä kielentutkija käyttää erikseen harjaan- 
nutettuna hyväkseen. 

Talmyn mukaan introspektio toimii tietyillä kielen alueilla parem- 
min ja toisilla huonommin, ja eräät kielenilmiöt ovat käytännössä sen 
ulottumattomissa. Talmy myös erottaa toisistaan kielenkäyttötilanteessa 
tapahtuvan introspektion (engl. online introspection) ja kielenkäytöstä ir- 
rallaan tapahtuvan introspektion (engl. offline introspection). Näiden teh- 
tävät eroavat toisistaan, ja niiden avulla voidaan myös tarkastella erilaisia 
kielenilmiöitä. Kielentutkija, joka käyttää kielitajuaan analyysivälineenä, 
turvautuu yleensä ensisijaisesti offline-introspektioon. 

Offline-introspektiolle suhteellisen helposti avautuvia seikkoja ovat 
Talmyn mukaan esimerkiksi tietyn sanan perusmerkitys (kissa, laulaa, 
punainen), ilmauksen edustama rekisteri (minä menen vs. mä meen) ja 
sen tyylillinen sopivuus tiettyyn kontekstiin, kieliopillisuus tai kielen- 
vastaisuus (sinä menet vs. *sinä menen), synonymia, samaan merkitys- 
kenttään kuuluminen (esim. työkalujen nimitykset) ja vastakkais- 
merkityksisyys (matala-syvä). Luettelosta voi huomata, että siihen 
kuuluu ennen kaikkea merkitykseen liittyviä kielenilmiöitä. Talmy 
(2007a) korostaakin, että juuri merkityksen tutkimus on kielitieteen ala, 
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jota ei voi harjoittaa käyttämättä introspektiota (eli kielitajua). Ilmiöinä, 
jotka avautuvat vain jonkin verran offline-introspektiolle, Talmy mainit- 
see kieliopillisten morfeemien merkitykset, sanaluokkajaon sekä ilmauk- 
sen muodon tai merkityksen salienssin (silmiinpistävyyden). Huonosti 
tai ei lainkaan offline-introspektion tavoitettavissa taas ovat muun muas- 
sa useiden kieliopillisten elementtien semanttiset komponentit (esim. 
liitepartikkelin -kin merkitys), polyseemisen ilmauksen kaikki merkityk- 
set, syntaktiset säännöt ja muodot sekä vaikkapa luettelon esittäminen 
sanoista, joissa on tietty fonologinen piirre (esim. viidentenä äänteenä r). 

Talmy (2007b) jaottelee vastaavasti tekijöitä, jotka avautuvat aidos- 
sa kielenkäyttötilanteessa tapahtuvan online-introspektion avulla joko 
helposti, jonkin verran tai eivät ollenkaan. Kielitajun online-käyttö 
on olennainen osa kielentutkijoiden usein harjoittamaa naturalistista 
observointia, jossa tehdään havaintoja aidosta kielenkäytöstä. Suhteel- 
lisen helposti avautuvia ilmiöitä ovat muun muassa keskustelun aihe- 
piiri, keskustelun koherenssin taso, puhujan parhaillaan ilmaisema 
käsitesisältö, (puhujan kannalta) sanottavan sisällön vielä ilmaisematta 
oleva osa, puheenvuoroa suunnittelevan kannalta sisältö, joka aiotaan 
ilmaista, kuulijan kannalta puhujan poikkeamat tyylistä ja hyvämuo- 
toisuudesta sekä virheet ja takeltelu. Jonkin verran avautuvia seikkoja 
ovat paralingvistiset ilmiöt eli sellaiset puheessa ilmenevät oheisilmiöt 
kuin puheen korkeus, voimakkuus, nopeus, sekä (puhujan kannalta) 
poikkeamat, jotka mahtuvat käytössä olevan rekisterin sisälle (ks. Ko- 
keellinen fonetiikka tk.). Seikkoja, jotka eivät lainkaan avaudu online- 
introspektiolle, ovat muun muassa käynnissä olevat, puheen tuottami- 


seen tai ymmärtämiseen liittyvät kognitiiviset prosessit. 


5.3. Lausesemantiikan esimerkkitapaus 


Tutkijan itsensä konstruoimilla esimerkeillä operoiva tutkimus on vah- 
vimmillaan silloin, kun tutkimuskysymys on muodoltaan sillä tavoin 
yleinen tai abstrakti, että sitä olisi vaikea palauttaa tietyn konkreetti- 
sen kielellisen muodon esiintymien tarkasteluun. Tällaiset pohjaavat 
usein teoreettisiin kysymyksiin. Käsittelemme seuraavaksi esimerkkinä 
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Huumon (2006) tarkastelemaa tutkimuskysymystä siitä, miten suomen 
objektin sijanvaihtelu toimii lauseissa, joissa joko subjektin tai objektin 
tarkoitteena on ns. inkrementaalinen teema (termistä ks. Dowty 1991). 
Inkrementaalinen teema on tarkoite, joka osallistuu tilanteeseen vai- 
heittain niin, että tilanteen edetessä ajassa yhä suurempi osa tarkoittees- 
ta on joutunut verbin ilmaiseman toiminnan kohtaamaksi. Tilanteen 
ajallinen kesto korreloi suoraan inkrementaalisen teeman tarkoite- 
kvantiteetin kanssa: kun koko kvantiteetti on osallistunut tilanteeseen, 
tilanne päättyy. Esimerkkinä on lause Pekka söi omenaa ~ omenan. Siinä 
objektin tarkoite on inkrementaalinen teema, sillä omena syödään osa 
kerrallaan ja tilanne kestää niin kauan kuin omenaa riittää. Kun koko 
omena on syöty, tilanne päättyy. Suomen objektin sijamerkinnällä tun- 
netusti ilmaistaan (eräiden muiden seikkojen ohessa) sitä, onko kuvattu 
tilanne kehityksenalainen vai päättynyt: partitiiviobjekti (omenaa) esittää 
tilanteen kehityksenalaisena, akkusatiiviobjekti (omenan) päättyneenä. 
Silloin kun objekti on inkrementaalinen teema, akkusatiiviobjekti kertoo 
samalla, että objektin koko tarkoite on osallistunut tilanteeseen (esim. 
koko omena on tullut syödyksi). 

Objektin sijamerkinnän osalta inkrementaalisen teeman käyttäyty- 
minen on ollut fennistiikassa tunnettu ilmiö jo pitkään. Huumo (2006) 
ryhtyykin pohtimaan sitä, miten objekti ja subjekti merkitään silloin, 
kun inkrementaalinen teema esiintyy subjektina. Tällöin tilanteen 
käynnissä oleminen tai päättyminen riippuu siitä, onko subjektin koko 
tarkoite jo ehtinyt osallistua siihen vai ei. Merkitäänkö myös subjekti- 
tarkoitteen osallistumisen vaiheittaisuus kieliopillisesti jollain tavoin, 
ja jos niin miten? 

Näin muotoiltuna kysymyksen ratkaiseminen korpuksen avulla oli- 
si hankalaa. Inkrementaalinen teema on abstrakti semanttinen rooli, 
joka ei korreloi suoraan minkään leksikaalisen tai kieliopillisen muoto- 
piirteen kanssa niin, että sitä voisi esimerkiksi automaattisesti etsiä kor- 
puksesta tavanomaisin hakukriteerein. On tietenkin mahdollista käydä 
manuaalisesti läpi tekstiaineistoa ja yrittää löytää transitiivilauseita, joi- 
den subjektin tarkoite olisi inkrementaalinen teema. Helpoin ja kätevin 
ratkaisu on kuitenkin käyttää tutkijan omaa kielitajua, yrittää sepittää 
tällaisen ehdon täyttävä, kielessä hyväksyttävä lause ja tarkastella sitä. 
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Huumo (2006) esittää tämäntyyppisen esimerkkilauseen: Tavarajuna 
sivuutti opastinta — opastimen. Esimerkissä objektin tarkoite (opastin) on 
pistemäinen ja kokonaisuutena mukana tilanteessa sen joka vaiheessa. 
Sitä vastoin subjektin tarkoite (tavarajuna) on pitkänomainen ja osal- 
listuu opastimen sivuuttamiseen osa kerrallaan niin, että opastimen 
kohdalla sitä sivuuttamassa on kullakin hetkellä vain jokin junan osa 
(esimerkiksi vaunu). Esimerkin objektin sija ja mahdollisuus valita joko 
partitiivi- tai akkusatiiviobjekti osoittavat, että merkintäperiaate on silti 
sama kuin aiemmassa esimerkissä, jossa inkrementaalinen teema oli 
objektina (syödä omenaa’). Jos tilanne esitetään kehityksenalaisena tai 
keskeneräisenä, käytetään partitiiviobjektia (opastinta), jos taas päätty- 
vänä, käytetään akkusatiiviobjektia (opastimen). Esimerkki osoittaa, että 
subjektitarkoitteenkin inkrementaalisuudesta seuraava tilanteen kehi- 
tyksenalaisuuden ja päättymisen oppositio ilmaistaan objektin sijalla, 
vaikka objekti itse ei nyt olekaan inkrementaalinen teema. 

Kielitajua käyttävä kielentutkija voi jatkaa pohdintaa kysymällä, pys- 
tyisikö subjektin (tavarajuna) oma sijanvalinta heijastelemaan tällaista 
eroa: voisihan ajatella, että kun juuri subjektin tarkoite on inkremen- 
taalinen teema, sijanvaihtelu merkittäisiinkin subjektiin eikä objektiin. 
Vastaus on kuitenkin kielteinen, sillä tällaista merkintää tavoitteleva 
partitiivi lauseessa *Tavarajunaa sivuutti opastimen on selvästi kielen- 
vastainen.'* Asian osoittaminen on oikeastaan mahdollista vain kieli- 
tajun ja itse tuotetun sekä kielenvastaiseksi havaitun esimerkin avulla, 
sillä negatiivista evidenssiä eli tällaisen lauseen esiintymättömyyttä ei 
voi korpuksista helposti havainnoida. Se, että tämäntyyppistä lausetta ei 
(todennäköisesti) löytyisi mistään aineistosta, ei vielä edes riittäisi osoit- 
tamaan ilmauksen kielenvastaisuutta. 

Subjektin ja objektin sijan tarkastelu tavarajuna-esimerkissä havain- 
nollistaa nominatiivin ja partitiivin erilaista distribuutiota eli jakaumaa 
tällaisessa ilmaustyypissä. Kielenilmiön ja jonkin kielellisen aineiston 
analysointia esimerkiksi minimipareilla ja rakenteiden käyttöalaa kos- 
kevaa distribuutiota tarkastelemalla voi pitää konkreettisena metodisena 
toimintana. Aineistonhankintametodeista (esim. kysely, haastattelu jne.) 
tällainen eroaa siten, että kyse on jo usein teoreettisesta argumentoin- 
nista ja jonkin ilmiön kuvaamisesta. 


LUKU 1 KIELITAJU KIELENTUTKIJAN TYÖKALUNA 231 


Palataksemme esimerkkiin tarkoitettua asiasisältöä kuvaisi kyllä 
esimerkiksi lause Osa tavarajunaa sivuutti opastimen, mutta tämä ei 
edustaisi tavoiterakennetta. Tavarajuna on partitiivissa sanan osa jälki- 
määritteenä (osa leipää, tarinaa yms.). Minimipariesimerkeillä operoi- 
misessa on tärkeää pitäytyä saman rakennetyypin piirissä. Myös esi- 
merkki Tavarajuna ohitti matkustajajunaa — matkustajajunan on siksi 
toimimaton, että se muuttaisi alkuperäistä asiaintilaa, jossa ohitettava 
on pistemäinen tarkoite (opastin). Jos kielitajun varaisesta lause-esimer- 
kistä tulee kiistaa, aina on käytännöllistä yrittää etsiä korpusesimerkkejä: 
Puomi oli ollut alhaalla ja ääni- ja valomerkit toiminnassa koko ajan, kun 
tavarajuna ohitti risteystä ja kun pikajuna oli saapunut hälytysosuudelle. 7 

Kielitajuaan hyödyntävän kielentutkijan ei kannata tyytyä vain yhteen 
esimerkkiin, sillä aina on mahdollista, että havaitun eron takana on mui- 
takin tekijöitä kuin se, joka oli huomion kohteena. On pohdittava mo- 
nenlaisia ehdot täyttäviä lauseita ja yritettävä aktiivisesti keksiä omalle 
hypoteesille ja sitä tukevalle esimerkille vastaesimerkkejä. Kieliopillisten 
seikkojen lisäksi esimerkiksi pragmaattiset tai leksikaaliseen semantiik- 
kaan liittyvät seikat saattavat vaikuttaa lauseiden hyväksyttävyyteen, joten 
näitäkin tekijöitä on hyvä yrittää muunnella. 

Aina on hyvä myös esittää jatkokysymyksiä ja lisähypoteeseja: entäpä 
jos sivuuttamisen tyyppiseen tilanteeseen vaiheittain osallistuva pitkän- 
omainen subjektitarkoite onkin kvantiteetiltaan rajaamaton eikä rajattu 
niin kuin tavarajuna? Huumo (2006) esittää esimerkin kerjäläisestä, 
jonka ohi vaeltaa turistien loputon (ja siten kvantitatiivisesti rajaama- 
ton) virta. Tällaista tilannetta transitiivisella sivuuttaa-verbillä kuvattaes- 
sa huomataan, että akkusatiiviobjekti onkin mahdollinen riippumatta 
siitä, onko tilanne kehityksenalainen vai ei. Lause Turistien loputon virta 
sivuutti kerjäläisen sallii akkusatiiviobjektin siinäkin tapauksessa, että se 
kuvaa käynnissä olevaa sivuuttamista. Toisaalta partitiivi tuntuu esimer- 
kissä ?Turistien loputon virta sivuutti kerjäläistä vastahankaiselta juuri 
siksi, että tilanne ei etene kohti päätepistettä, jolloin se päättyisi, sillä 
turistivirta esitetään loputtoman pitkänä. Samantapaisia ovat lauseet 
Joessa virtaava vesi kiertää nykyään kaupungin keskustan kanavaa pitkin 
ja Liikennevirta ohitti onnettomuuspaikan kiertotietä pitkin. Molemmissa 
subjektitarkoite on ainesmäärältään rajaamaton. Voidaankin havaita, 
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että objektin sijanvalinta toimii hieman eri tavoin silloin, kun tilantee- 
seen vaiheittain osallistuva subjektitarkoite on ainesmäärältään rajalli- 
nen kokonaisuus (tavarajuna), ja silloin, kun tämä on ainesmäärältään 
rajaamaton (turistien virta, vesi). Tällaiseen havaintoon voi päätyä ky- 
seenalaistamalla tavarajuna-esimerkin ja koettamalla keksiä sille vasta- 
esimerkkejä. Tavarajuna-esimerkin perusteella tehty päätelmä siis tar- 
kentuu rajaamaton ainesvirta -tyyppisten esimerkkien avulla. 


6. Yhteenveto 


Kielitajun käyttö on olennainen osa lähes kaikkea kielitieteellistä tut- 
kimusta. Silloinkin kun varsinainen tutkimusaineisto on aidosta 
kielenkäytöstä peräisin, tutkija yleensä turvautuu kielitajuunsa ainakin 
tutkimuskysymyksiä ja hypoteeseja muotoillessaan, aineistoa luokitel- 
lessaan, tutkimustuloksia tulkitessaan ja päätelmiä tehdessään. Kieli- 
taju on myös opinnäytettä kirjoittavalle opiskelijalle tärkeä, ellei tärkein 
työkalu. Kielitaju ei metodina ole ”epätieteellinen” tai ”mielivaltainen”, 
sillä kielellisen normin yhteisyys puhujayhteisön jäsenien kesken toimii 
takeena siitä, ettei mielivaltaisia väitteitä voi esittää. Kuten mitä tahan- 
sa metodia myös kielitajua on mahdollista käyttää hyvin tai huonosti: 
esimerkiksi Dabrowskan (1996) kritisoimat tutkijat ovat kielitajunsa 
varassa muodostaneet hyvin kompleksisia esimerkkejä, jollaisia ei esiin- 
ny aidossa kielenkäytössä ja joita kaikki äidinkielisetkään puhujat eivät 
pysty ymmärtämään. 

Hiukan toinen kysymys on se, milloin tutkimuksen aineistona voi ja 
kannattaa käyttää itse sepitettyjä esimerkkejä. Luvussa 5.3. kuvasimme 
pelkistetysti erään tällaisen tutkimuksen kulkua. Tutkimuskysymykset 
voivat tällaisessa tutkimuksessa olla muotoilultaan varsin abstrakteja. 
Vastauksen saamiseksi riittää periaatteessa tietynlaisen esimerkin tuot- 
taminen ja sen hyväksyttävyyden tai kielenvastaisuuden toteaminen sekä 
yleensä myös sen merkitykseen vaikuttavien tekijöiden systemaattinen 
teoreettinen analysointi. Kielitajun varassa tuotettu esimerkki voi toimia 
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kirvokkeena tutkimuskysymysten täsmentämiseksi niin, että asiaa voi- 
daan edelleen tutkia todellista kielenkäyttöä edustavasta aineistosta tai 
muilla kielentutkimuksen menetelmillä. 

Itse tuotettujen esimerkkien keksiminen ja puntarointi, niiden 
merkitykseen vaikuttavien seikkojen erittely sekä mahdollisten vasta- 
esimerkkien sepittäminen vaativat tuekseen harjaantumista ja analyyt- 
tista taitoa, jollainen yleensä kehittyy vasta melko pitkän tutkimuskoke- 
muksen myötä (vrt. Talmyn vertaus urheilijaan). Ainakaan ensimmäisiä 
opinnäytteitään, kandidaatintutkielmaa tai gradua, laativalle opiskelijal- 
le sitä ei voi suositella ensisijaiseksi tai yksinomaiseksi menetelmäk- 
si. Kielitajun käyttöä tutkimusmenetelmänä on paras harjoitella ensin 
tosiasiallista kielenkäyttöä edustavalla aineistolla, joka opettaa ymmär- 
tämään kielen ja sen käyttöön liittyvien tekijöiden moninaisuutta. Todel- 
lista kielenkäyttöä edustavaa aineistoa tutkivakin voi tietysti pohtia — ja 
usein pohtiikin — mitä tapahtuisi, jos ilmauksen yksi elementti korvat- 
taisiin toisella, ja päätyä näin tuottamaan ”laboratoriolauseen”, joka toi- 
mii kielitajun varaisena minimiparina aidosta kielenkäytöstä poimitulle 
esimerkille. 
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VIITTEET 


Asteriski (*) on konventionaalinen tapa merkitä ei-hyväksyttävyyttä tai epäkieliopillisuutta. 
Runous ja kielellinen leikittely ja jopa kielivirheet ovat toki ymmärrettävissä, mutta tuol- 
loin taustalla on aina jokin normatiivinen tai muu kehys, jota vasten tulkintaa verrataan. 
Kielellinen leikittely ei yleensä muuta normijärjestelmää. 

On toistaiseksi vielä erillisen teoreettisen tutkimuksen aihe pohtia sitä, rajaako tyypil- 
linen kielitajun varainen yleiskielinen aineisto kielestä esitetyt väitteet koskemaan vain 
standardikielimuotoa vai voiko ja millä edellytyksillä kielitajun varassa sanoa muutakin 
kielestä. Yleisesti kielitieteellisilla aineistoilla voidaan perustella kielen universaaleja 
(kaikille tai monille kielille yhteisiä ominaisuuksia), jonkin yksittäiskielen ominaisuuksia, 
yksittäiskielen genren, rekisterin ja variaation piirteitä tai yksittäisen aidon kielenkäyttö- 
tilanteen ominaisuuksia. Kielitajulla ei havainnollisteta jälkimmäisintä. 

Ensikielen tai äidinkielen rakennetta koskeva taito saavutetaan asteittain, joten kieli- 
taidon mittana pidetään yleensä oletettua aikuiskielen kehittynyttä kielitajua. Tämä saa- 
vutetaan toisella kymmenellä ikävuodella. 

Leikkikieli kontinkielestä on kuitenkin todettava, että se perustuu luonnolliselle kielelle 
(suomelle) tietyin muodostussäännöin, mutta kukaan ei opi sitä äidinkielenään. Leikki- 
kielet ovat yleisesti harvinaistuneet. 

Tarkoitamme ei-kielentutkijoilla tai (tavallisilla) kielenpuhujilla kaikkia niitä äidinkielisiä 
puhujia, joilla ei ole kielentutkijan koulutusta eikä ensisijaisesti tieteellis-teoreettista 
motivaatiota kielen tarkkailuun. 

Omiin tajunnansisältöihin kohdistuvan itsehavainnoinnin lisäksi kielitajua lähellä oleva 
arkinen metodi kielentutkijalla on luonnollisen kielenkäytön ulkopuolinen tarkkailu 

tai eri astein osallistuva havainnointi eli nk. naturalistinen observointi (ks. online- 
introspektio, luku 5.2.). Tällainen voi satunnaisena toimintana synnyttää relevantteja 
tutkimushypoteeseja tai systemaattisena toimintana johtaa merkittävään aineisto- 
keräelmään jostakin kielenkäytön ilmiöstä. (Ks. Karlsson 1998, 285-286.) 

Muita kuin kieltä koskevia varmoja asioita kuvaavat esimerkiksi lauseet olen elossa, minul- 
la on sydän ja en ole käynyt koskaan Kuussa. Tosiasiassa varmuus koskee Wittgensteinin 
mukaan tämän tyyppisten tiedonsisältöjen muodostamaa järjestelmää (f 410). 

Kieliopin säännön ”alaraja” lienee vedettävissä jonnekin fonologian ja fonetiikan raja- 
maastoon. Esimerkiksi suomen rajageminaatio (esim. hernekeitto [hernek:eitto]) voi olla 
monelle tietoisuuden alinen ilmiö, vaikka se toteutuu säähnönmukaisesti monissa suo- 
men muotoryhmissä. Toinen esimerkki voisi koskea esim. diftongin avartumisasteita 
(hieno — hiano). On kuitenkin huomattava, että tällaisten ilmiöiden tiedostamista ei ole 
kovin perusteellisesti kartoitettu. 

Propositionaaliset tietosisällöt ovat väitelauseen muodossa esitettävissä olevia usko- 
muksia, esim. olen tyytyväinen (vrt. tyytyväisyyden kielentämätön mutta introspektiolla 
tavoitettava tunne kokijan mielessä) (Niiniluoto 1997 [1980], 137). 

Esimerkissä ongelmana on Apollonioksen aikansa normaalikreikkaa koskevan kielitajun 
mukaan se, että modaalipartikkeli (an) ei esiintyisi indikatiivin futuurin (grapso) kanssa. 
Kuitenkin homeerisessa kreikassa partikkelin varianttia ken käytetään näin. (Minna Sep- 
pänen h.t. 29.1.2018.) 
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12 Vastanäkemyksenä introspektionismille psykologiassa kehittyi 1900-luvun alkupuolella 
behaviorismi lähestymistavaksi, jossa pätevää tietoa ajateltiin saatavan vain ulkoista 
käyttäytymistä havainnoimalla (ks. Lyons 1986, luku 2; positivismista ks. Johdannon 
luku 2 tk.). 

13 Tesniere käyttää kielitajusta termiä introspektio (suom. toim). 

14 Suomessa i : e -nominit ovat niitä nomineja, joiden nominatiivi päättyy i:hin (korpi) ja 
taivutuksen vartalovokaali on e (korve-). Tähän taivutustyyppiin kuuluvat muun muassa 
sanat sormi, ovi, savi ja kivi. 

15 Talmy käyttää kielitajusta yksinomaan termiä introspektio, jota tässä seurataan. 

16 Esimerkiksi lauseen Monia tavarajunia sivuutti opastinta — opastimen partitiivisubjekti 
on käypä, sillä monikollinen kvanttorisana monia epämääräistää subjektitarkoitteiden 
määrän. 

17 Yle Uutiset, 26.7.2001. https: //yle.fi/uutiset/3-5107078. 

18 Kysymysmerkki esimerkin edessä ilmentää esimerkin kyseenalaista suomenmukaisuutta 


(ks. kuvio 1, mahdollisesti p). 
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Mika? 


Kysely on keino tutkia, mitä ihmiset ajattelevat, tietävät, tekevät tai ko- 
kevat. Tiedon keruu ja mittaus tapahtuvat tutkimusta varten tehdyllä 
kyselylomakkeella, jonka laatiminen edellyttää sekä kielentutkimuksen 
että tilastotieteen osaamista. Mittausten tuloksena syntyy aineistoja, 
joita analysoidaan pääosin tilastollisilla menetelmillä. Kyselyllä kielestä 
voidaan saada sellaista uutta tietoa, jota on vaikeaa tai mahdotonta ta- 
voittaa muilla keinoilla. 


Katso myös: 

Johdanto 

Luku 1 Kielitaju kielentutkijan työkaluna 

Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 
Luku 16 Antropologinen lingvistiikka 


Luku 23 Käännöstiede ja sen menetelmät 
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1. Johdanto 


Kyselyn käyttöön opastetaan lukuisissa yhteiskunta- ja käyttäytymis- 
tieteiden tutkimusoppaissa (esim. Alkula, Pöntinen & Ylöstalo 1994; 
Foddy 2001; Fowler 1995; Saris & Gallhofer 2007; Vastamäki 2015; 
Vehkalahti 2019). Tässä artikkelissa tarkastelemme kyselyä kielentutki- 
muksen menetelmänä. Esittelemme kyselyn pääperiaatteita ja annam- 
me käytännön ohjeita toimivan kyselyn tekemiseen. Aiheesta syvälli- 
semmin kiinnostunutta ohjaamme menetelmän tärkeimpien lähteiden 
äärelle kielitieteen ulkopuolelle. 

Kehotamme lukijaa pohtimaan erityisesti kolmea tutkimuksen on- 
nistumisen kannalta olennaista kohtaa: 1) Miksi kysyt? Mikä on se tut- 
kimuskysymys, johon haluat kyselyllä saada vastauksen? 2) Mitä kysyt? 
Mitä sinun on kysyttävä, jotta pystyt vastaamaan tutkimuskysymykseesi? 
3) Miten kysyt? Millaisia tilastollisia ja muita näkökohtia sinun on huo- 
mioitava, jotta tutkimustuloksesi olisivat mahdollisimman luotettavia? 

Kysely on keino tutkia mittaamalla, mitä ihmiset ajattelevat, tietävät, 
tekevät tai kokevat. Mittaus tarkoittaa sitä, että tutkittavasta ilmiöstä ke- 
rätään aineistoa, joka koostuu pääasiassa numeroista. Määrällinen tut- 
kimus, mukaan lukien kysely, edellyttää useimmiten juuri numeerista 
mittausta. Näin kerättyjä aineistoja analysoidaan erilaisilla määrällisillä 
eli tilastollisilla menetelmillä. Kyselyllä voidaan kerätä myös sanallisia 
vastauksia, mutta sanalliset ja muut laadulliset aineistot on usein pa- 
rempi analysoida laadullisilla menetelmillä. Tässä artikkelissa tarkaste- 
lemme kyselyä sen tyypillisessä käytössä numeromuotoisen kieliaineis- 
ton keruussa ja analysoinnissa, joskin monet näkökulmat sopivat myös 
laadulliseen kyselyaineistoon. 

Frilaisia ilmiöitä mitataan erilaisilla mittareilla: vaa'alla mitataan pai- 
noa, mittanauhalla pituutta, sykemittarilla sydämen sykkeen taajuutta. 
Paino, pituus ja syke ovat suhteellisen yksinkertaisia mitattavia, ja mai- 
nitut mittarit tuottavat selviä numeroarvoja. Ihmisten tiedot, käsitykset 
ja asenteet ovat sen sijaan varsin monimutkaisia ilmiöitä, eikä niiden 
mittaukseen ole valmiita laitteita. Mittaus voi kuitenkin onnistua kysely- 
lomakkeella. Kyselylomaketta voikin ajatella kokoelmana mittareita, 


LUKU 2 KYSELY 24] 


joilla mitataan ihmisen käsityksiä mitä erilaisimmista asioista. Ihmi- 
sen ajatteluun liittyvissä tutkimuksissa mittarit on usein rakennettava 
jokaista tutkimuskysymystä varten uudelleen, joskin toisinaan voidaan 
hyödyntää valmiita, aiemmin testattuja mittareita. Kyselylle on tyypil- 
listä, että kaikki tutkimukseen valitut ihmiset vastaavat samoihin kysy- 
myksiin. Kiinnostuksen kohteena eivät niinkään ole yksittäisen ihmisen 
vastaukset vaan kaikkien vastausten perusteella tehtävät tiivistykset, jot- 
ka heijastavat tutkittavaa ilmiötä. 

Ihmisen ajatteluun liittyvien, moniulotteisten ja usein abstraktien 
ilmiöiden mittaus ei onnistu ihan suoraviivaisesti. Väliin tarvitaan vaihe, 
jota kutsutaan operationalisoinniksi. Tämä hankalan kuuloinen sana tar- 
koittaa sitä, että tutkittavan ilmiön ulottuvuudet, siis käsitykset ja asen- 
teet, puretaan pienemmiksi paloiksi ja lopulta konkreettisiksi kysymyk- 
siksi tai väitteiksi, jotka voidaan esittää vastaajille. Operationalisointi on 
useimmiten välttämätön vaihe myös kieleen liittyvissä kyselytutkimuk- 
sissa. Esimerkiksi tunnesanojen merkityksiä tai vihapuheeseen liittyviä 
asenteita ei yleensä voida kysyä suoraan. Tutkijalla voi olla hypoteesi, 
jonka mukaan tietyssä ihmisryhmässä ei periaatteessa hyväksytä viha- 
puhetta mutta käytännössä itse tuotetaan sitä. On mietittävä, millais- 
ten kysymysten välityksellä ilmiöstä saadaan tietoa. Yhden abstraktin 
asian mittaus voi vaatia monta kysymystä. Näistä kysymyksistä syntyy 
mahdollisesti kokonainen mittari, joka puolestaan muodostaa osan 
kyselylomaketta. 

Artikkelin aluksi tarkastelemme kyselyn historiallista ja filosofista 
taustaa, kielentutkimuksessa tehtyjä kyselyjä sekä kyselyyn liittyviä eet- 
tisiä näkökulmia (luku 2). Sen jälkeen esittelemme kyselyn käytännön 
vaiheita (luku 3). Päätösluvussa (4) kokoamme artikkelimme tärkeim- 
mät näkökohdat. 
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2. Kyselyn taustaa 


2.1. Kyselyn synty ja kehitys 


Toisin kuin monet muut kielentutkimuksessa käytettävät menetelmät 
kysely on saanut alkunsa ja kehittynyt tieteelliseksi tutkimuskeinoksi 
kielitieteen ulkopuolella. Tiedon keruun ja analysoinnin menetelmiä 
kehitettiin tilastotieteessä, kun taas mittauksen haasteisiin perehdyttiin 
pitkään enemmän psykologiassa. 

Ensimmäiset dokumentoidut kyselytutkimukset juontavat juurensa 
väestölaskentaan ja markkinatutkimuksiin. Vuonna 1916 The Literary 
Digest -viikkolehti teki kyselyn lähettämällä miljoonia postikortteja ym- 
päri Yhdysvaltoja ja ennusti tulosten perusteella oikein Wilsonin valin- 
nan presidentiksi. Tutkimus onnistui kerrasta toiseen, kunnes vuonna 
1936 tapahtui kömmähdys. Tutkijat eivät ottaneet huomioon sitä, että 
heidän 2,3 miljoonaisesta vastaajajoukostaan valtaosa oli republikaaneja. 
Samaan aikaan George Gallup ennusti oikein Rooseveltin äänivyöryn 
tekemällä huomattavasti pienemmän mutta väestötasolla edustavan ky- 
selytutkimuksen (ks. Wikipedia s.v. opinion poll). 

Kyselyn avulla saadun aineiston luotettavuudessa ei kuitenkaan ole 
kyse yksinomaan luotettavasta tiedon keruusta. Riippumatta siitä, keille 
kysymykset esitetään, ne pitää myös esittää pätevällä tavalla. Kysely on 
keino mitata monimutkaisiakin ilmiöitä. Mittauksen haasteisiin ihmis- 
tieteissä perehdyttiin alun alkaen psykologiassa, varhaisten älykkyys- 
tutkimusten yhteydessä (Spearman 1904). Sittemmin niin psykologit, 
kasvatustieteilijät, yhteiskuntatieteilijät kuin tilastotieteilijät ovat kehit- 
täneet kyselytutkimuksessa tarvittavia menetelmiä sekä tiedon keruun 
ja mittauksen että analysoinnin tarpeisiin. (Kyselymenetelmän käytöstä 
ja kehityksestä Suomessa ks. Alastalo 2005.) 
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2.2. Millaisissa kielitieteen tutkimuksissa kyselya on 
kaytetty 


Ensimmäiset dokumentoidut kielitieteen kyselyt löytyvät 1800-luvun 
lopun murretutkimuksista, joissa kartoitettiin Saksassa ja Ranskassa 
puhuttuja kielimuotoja (Chambers & Trudgill 1980, 15-17). Postikyse- 
lyt vaihtuivat pian koulutettujen murteenkerääjien kenttämatkoihin. 
Kyselyt olivat osa myös suomalaisen dialektologian varhaisia vaiheita 
(ks. Haastattelu aineistonkeruun metodina sosiolingvistiikassa tässä 


kirjassa). 


Kysely tutkijan ulkopuolelle laajennettuna kielitajuna on ollut käytös- 


sä jo paljon kauemmin. Kyselyn taustalla on yleensä tutkijan kielitajun 
hyödyntäminen (ks. Kielitaju kielentutkijan työkaluna tk.). Kysely on lä- 


hellä myös empiirisen kielentutkimuksen menetelmiä, etenkin haastat- 
telua (ks. Haastattelu aineistonkeruun metodina sosiolingvistiikassa tk.) 


ja kenttätyömenetelmiä (ks. Kielten dokumentointi ja kieliopin kuvaus 
tk.). Läheisyys haastatteluun näkyy myös terminologiassa: englannin 
survey kattaa sekä kysely- että haastattelututkimuksen, eikä sanalle ole 
vakiintunutta suomennosta. 

Varhaisten vaiheiden jälkeen kyselyjä tai kyselyn tapaisia menetel- 
miä on käytetty eri puolilla maailmaa kielen rakenteiden, merkitysten ja 
käytön tutkimuksessa (esim. Schilling 2013). Kyselyllä on mitattu mm. 
kielitaitoa ja asenteita ja kartoitettu uhanalaisten kielten tilannetta. Suo- 
malaisessa kielitieteessä kyselyä on käytetty etenkin sosiolingvistiikassa 
ja dialektologian tutkimuksessa. Sillä on tutkittu mm. murrematkimuk- 
sia (Leino 1968), murreasenteita (esim. Mielikäinen & Palander 2002), 
Helsingin puhekieltä (esim. Ainiala & Lappalainen 2010) ja henkilö- 
viittauksia (Priiki 2011; Siitonen 2016). Kysely on ollut melko suosittu 
menetelmä myös leksikaalisessa semantiikassa, jossa tutkimuskohteina 
ovat olleet mm. onomatopoeettisten sanojen tuntemus ja tulkinta (Les- 
kinen 1991), polysemia (Raukko 2002) ja synonymia (Jürvetson 2015; 
Vanhatalo 2002; 2005). Sitä on käytetty myös kielitieteen terminologian 
tutkimuksessa (Luodonpää-Manni 2013). 

Kielitieteen kyselytutkimukset ovat perustuneet yleensä harkinnan- 
varaisella näytteellä kerättyyn aineistoon (ks. luku 3.3.), vaikka myös 
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otantaan perustuvia tutkimuksia on tehty. Hyvänä kotimaisena esi- 
merkkinä otannalla kerätystä aineistosta on englannin kielen asemaa 
2000-luvun Suomessa selvittänyt kyselytutkimus, johon saatiin Väestö- 
rekisterikeskuksen kautta noin 1 500 vastaajaa (Leppänen ja muut 2011). 

Kielentutkimuksessa käytettyjen kyselyjen metodologinen ja termino- 
loginen johdonmukaisuus on vaihdellut. Tieteenalojen välisen keskus- 
telun lisääntyessä 2000-luvulla on tietoisuus muilla aloilla kehittyneis- 
tä metodeista lisääntynyt ja vaatimus metodologisesta tarkkuudesta 
kasvanut. Täsmällisyyttä edistävät osaltaan myös tieteenalojen väliset 
julkaisukanavat, jotka vaativat yhdenmukaisia metodologisia käytäntöjä 
eri tieteenalojen kyselytutkimuksissa. 


2.3. Kyselyn käytön perusteet 


Kysely on edelleen tärkeä tutkimusmenetelmä yhteiskunta- ja käyttäyty- 
mistieteissä. Menetelmä on altis sekä otanta- että mittausvirheille, mutta 
sille on vaikea keksiä vaihtoehtojakaan. Yksi kyselymenetelmän perus- 
ajatuksia on, että tunnetut virheet pyritään tiedostamaan, ottamaan huo- 
mioon ja korjaamaan. Usko signaalin eli tietoa välittävän ilmiön löyty- 
miseen säilyy silloinkin, kun kaikkia häiriötekijöitä ei tunneta. Joskus 
on spekuloitu sillä, voisivatko esimerkiksi neurologiset mittaukset tehdä 
turhiksi kyselyjä. Toisaalta myös niissä on häiriötekijöitä, eikä virheetön- 
tä mittausta olekaan (Vehkalahti 2019, 17). 

Kielitieteessä oletetaan, että kyselyllä voidaan riittävällä tarkkuudella 
tavoittaa vastaajan kielitaju tai ainakin vastaajan käsitys kielitajustaan 
(ks. Kielitaju kielentutkijan työkaluna tk.). Kyselyllä voidaan tutkia vas- 


taajan tietoisten käsitysten lisäksi myös tiedostamattomia asioita, kuten 
asenteita tai kielen käyttöä. Kysely tulee mukaan tutkimusasetelmaan 
usein silloin, kun jotain kielen ilmiötä on vaikeaa tai mahdotonta tutkia 
yksinomaan kielitajulla (ks. Kielitaju kielentutkijan työkaluna tk.) tai ha- 


vainnoivilla menetelmillä (ks. Johdannon luku 1 tk.). 


Tieteenfilosofisesti kiinnostava on kysymys kyselymenetelmän 
muokattavuudesta kielentutkimuksen tarpeisiin tai tutkijan rajoituk- 
siin. Voiko ja saako kyselyn käyttö kielentutkimuksessa poiketa niistä 
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metodologisista normeista, jotka vallitsevat kielitieteen ulkopuolella? 
Olisiko tämä joissain tapauksissa jopa suotavaa? Millaisia nämä mah- 
dolliset normista poikkeamiset voisivat olla, jotta menetelmää vielä voi- 
daan nimittää kyselyksi? Kielentutkija voi kohdata työssään tämäntapaisia 
metametodologisia kysymyksiä. Perehtyminen kyselymenetelmän meto- 
dologisiin normeihin muilla tieteenaloilla voi auttaa vastausten löytämi- 
sessä (esim. Croves, Fowler, Couper, Lepkowski, Singer & Tourangeau 
2009). 


2.4. Kyselyyn erityisesti liittyviä eettisiä seikkoja 


Kyselyyn liittyy ilmeisiä eettisiä kysymyksiä, esimerkiksi vastaajien hen- 
kilötietojen keruu ja säilytys, vastaajien mahdollinen alaikäisyys sekä 
tutkimuskohteena olevien aiheiden mahdollinen arkaluontoisuus. Ky- 
selyaineiston keruu voi tarvita keruupaikasta (esim. oppilaitokselta) 
tutkimusluvan. Kyselyaineistojen keruuta ja säilytystä koskevat eetti- 
set säännökset voivat vaihdella eri maissa, mikä tulee ottaa huomioon 
kansainvälisiin julkaisuihin tähtäävissä tutkimuksissa (ks. Johdannon 
luku 4 tk.). 

Vähemmän ilmeisiä mutta tärkeitä eettisiä kysymyksiä ovat metodo- 
loginen ja terminologinen systemaattisuus sekä tulosten tulkinta, jossa 
ongelmat liittyvät usein näyteaineistoon perustuvien tulosten yleistämi- 
seen vastaajajoukon ulkopuolelle (tulkinnasta lisää ks. luku 3.3.). 


2.5. Terminologisia haasteita 


Kyselymenetelmän systemaattinen kehittäminen yhtäällä (tilastotiede, 
psykologia) ja spontaani kehittyminen toisaalla (esim. kielentutkimus) 
on aiheuttanut runsaasti terminologista variaatiota. Ilmeisen tahatto- 
malla variaatiolla voi olla haitallisia seurauksia. Virheellinen termino- 
logia voi aiheuttaa metodologisia virheitä itse tutkimusprosessissa. 
Esimerkiksi aineistonkeruuseen liittyvien termien otos ja näyte sekoit- 
taminen voi johtaa tulosten virheelliseen yleistämiseen (määritelmistä 


246 ULLA VANHATALO JA KIMMO VEHKALAHTI 


ks. luku 3.3.). Terminologinen vaihtelu voi myös estää muiden alojen 
tutkijoita löytämästä hakusanoilla, mitä kielentutkimuksessa on tehty. 
Itse kysely-termi on monissa tutkimuksissa nimetty testiksi, esim. kysely- 
testi (Raukko 2002; Vanhatalo 2002; Vanhatalo 2005; mahdollisesti 
näitä seuraten myös Itkonen & Pajunen 2010 sekä Luodonpää-Manni 
2013), parafraasitesti (Västi 2012) ja kansandialektologinen testi (Räsänen 
& Palander 2015). Kysely-termissä pitäytymistäkin sentään esiintyy (esim. 
Priiki 2011). Sanan testi käyttäminen antaa turhan kapean kuvan tilas- 
tollisen analyysin mahdollisuuksista: tutkimuksessa saatetaan olla kiin- 
nostuneita tiivistämään ja kuvailemaan tutkitun ilmiön ominaispiirteitä 
myös ilman, että analyyseihin liittyy mitään tilastollisia testejä. Kysely 
voi siis olla esimerkiksi alustava kartoitus jostain ennen tutkimatto- 
masta ilmiöstä. Kyselyn tuottama tieto taas voi nostaa esiin hypoteeseja, 
joita voidaan myöhemmin ehkä myös testata, joko samalla tai kokonaan 
uudella aineistolla. 


3. Kuinka kysely tehdään 


Käymme tässä luvussa pääpiirteittäin läpi kyselyn tärkeimmät vaiheet 
tutkimuksen suunnittelusta (3.1.) kyselylomakkeen laatimiseen (3.2.), 
aineiston keruuseen (3.3.), analyysiin (3.4.) ja tulosten tulkintaan (3.5.). 
Keskitymme erityisesti kyselylomakkeen suunnitteluun. 

Metodioppaissa esitetään usein tapaustutkimuksia, joissa kerrotaan, 
miten ideasta päästiin lopputulokseen. Metodologisten pohdintojen ja 
harha-askelten siivoaminen tutkimusraporteista voi kuitenkin luoda sen 
käsityksen, etteivät tällaiset kuuluisi tutkimusprosessiin. Tätä virheel- 
listä käsitystä oikaistaksemme asetumme tässä luvussa lukijan vierelle 
tekemään aitoa kielitieteen alan tutkimushanketta (Vanhatalo ja muut 
2019). Olemme havainnoineet tutkimusprosessiamme reaaliaikaisesti 
ja kirjoittaneet sitä auki. 
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Tapaustutkimuksemme kuuluu leksikaalisen semantiikan eli sanojen 
merkityksen tutkimuksen alaan. Se vastaa laajuudeltaan suunnilleen 
pro gradu -työtä. Teoreettisena viitekehyksenä on alkusanakieli (engl. 
Natural Semantic Metalanguage), jossa semanttisia sisältöjä muotoillaan 
yksinkertaisemmin uudestaan (Goddard & Wierzbicka 2014; Vanha- 
talo & Tissari 2017). Tapaustutkimuksemme tavoite on selvittää, tun- 
nistavatko äidinkieliset suomen puhujat alkusanakielisiä tunnesanojen 
(ilo, suru, inho, viha, pelko, hämmästys, rakkaus) selityksiä. Tutkimus- 
asetelmassa etsitään myös lisätietoa tunnesanojen mahdollisesta 
universaaliudesta. 


3.1. Tutkimuksen suunnittelu 


Kyselytutkimuksen suunnittelun pohjalla ovat jo luvussa 1 esitetyt isot 
tutkimuskysymykseen liittyvät aiheet. Vielä tätä varhaisempaan suun- 
nitteluvaiheeseen on liittynyt kysymys tutkimusmetodien valinnasta. 
Kyselyyn päädytään usein silloin, kun vastausten saaminen tutkimus- 
kysymyksiin on muilla menetelmillä vaikeaa tai mahdotonta. Samalla 
pidetään todennäköisenä, että tutkittava aihe on riittävän mielenkiintoi- 
nen houkuttelemaan vastaajia. Suunnitteluvaiheessa selvitetään myös 
se, yhdistetäänkö kyselyyn muita menetelmiä ja millaisia tutkimuseetti- 
siä kysymyksiä aiheeseen mahdollisesti liittyy. 

Kyselytutkimuksen käytännön suunnittelu kannattaa aloittaa tu- 
tustumalla kyselymenetelmän käyttäjän parhaaseen apuvälineeseen, 
mittausmalliin, joka periytyy jo varhaisista psykologisista tutkimuksista 
(Thurstone 1931; Spearman 1904). Mittausmalli auttaa hahmottamaan 
tutkimuksen kokonaisuutta ja helpottaa lomakkeen laatimista. Suosit- 
telemme, että mittausmalli tulostetaan riittävän isolle paperille, sitä 
täydennetään kynällä ja se kiinnitetään työpöydän yläpuolelle. Mittaus- 
malliin ei erikseen eksplikoida tutkimuskysymystä, mutta se kulkee läpi 
koko tutkimuksen punaisena lankana. 

Kuvan 1 vasemman laidan katkoviivalla merkityt ympyrät ovat tutki- 
jan alustavia ideoita ja havaintoja abstraktin ilmiön mahdollisista ulot- 
tuvuuksista. Kysymysmerkit kuvaavat tutkimuksen alkuun kuuluvaa 
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Kuva 1. Mittausmalli alkutekijöissään (Vehkalahti 2019, 21). 
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epävarmuutta. Tutkimuksen myöhemmissä vaiheissa vasemman lai- 
dan ympyröitä kutsutaan faktoreiksi. Kielentutkija lähtee tutkimaan 
moniulotteista ilmiötä, jossa on erilaisia ulottuvuuksia. Katkoviiva ko- 
rostaa sitä, että kyse on tutkijan teoreettisista ajatusrakennelmista, joita 
ei kerrota tutkimukseen osallistuville aineiston keruuvaiheessa. 


Kirjoitamme vasemman laidan ympyröihin tunnesanat. Mittaus- 
mallimme kuvaa näin seitsenulotteista tunnesanojen kokonaisuut- 
ta: sanoja ja niiden oletettuja merkityssisältöjä. 


Ympyröissä olevien sisältöjen vahvistamiseksi tai kumoamiseksi tarvi- 
taan tietoa, jota saadaan oikean laidan isoihin laatikoihin muodostetta- 
villa kysymyksillä tai väitteillä. Näitä kysymyksiä tai väitteitä kutsutaan 
osioiksi. Jotta ympyröissä oleviin oletuksiin päästään käsiksi, osioita täy- 
tyy joskus olla paljonkin. Kysymysten muodostamisen prosessia kutsu- 
taan operationalisoinniksi. Vain tutkijan tiedossa olevat abstraktiot ovat 
kuvion vasemmassa laidassa, vastaajan näkemä konkretia eli kysymykset 
oikeassa. 


Oikean laidan laatikoihin kirjaamme sanojen merkityspiirteet ja 
kokonaiset merkitysten selitykset. Näistä syntyvät lomakkeemme 
kysymykset. Kun osa merkityspiirteistä liittyy useampaan tunne- 
sanaan, tiedämmekö lopulta, mitä tunnetta milläkin kysymyksellä 
mitattiin? Tilastotieteilijä vakuuttaa, että kaaoksesta tulee löyty- 
mään järjestys. 

Osa merkityspiirteistä tulee asettumaan selvästi joidenkin 
tunnesanojen kohdalle. Näin esimerkiksi kaikki pelkoon liittyvät 
kysymykset korreloivat keskenään. Yksittäiset merkityspiirteet ja 
niiden yhdistelmät lisäävät luotettavuutta. Isoon kysymysmäärään 
sulautuvat myös sellaisenaan liian ilmeiset kokonaiset merkityksen 
selitykset. 


Kuvassa isojen ympyröiden välissä näkyvät pikkuympyrät kuvaavat il- 
miön sellaisia ulottuvuuksia tai tutkijan taustaoletuksia, joita tutki- 
ja tiedostamattaan tai tarkoituksella jättää tutkimuksen ulkopuolelle. 
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Pikkulaatikot puolestaan ovat mahdollisia kysymyksiä, joita tutkija muo- 
dostaa tai ei muodosta mutta jotka eivät tule kyselyyn. Molemmat pikku- 
merkinnät kuvaavat myös sitä, että ympyröiden tai laatikoiden oikea 
lukumäärä ei välttämättä heti ole tutkijallekaan selvää; ne tyypillisesti 
tarkentuvat suunnittelun edetessä. 

Ihannetapauksessa yhdestä ympyrästä lähtee viivat moneen laatik- 
koon mutta jokaisesta laatikosta lähtee viiva yhteen ympyrään. Tämä tar- 
koittaa sitä, että jokaista tutkittavaa ulottuvuutta voidaan mitata monella 
kysymyksellä mutta jokaisella kysymyksellä mitataan lähtökohtaisesti 
vain yhtä ulottuvuutta. 

Ihmistieteiden mittausasetelmissa on usein paljon epävarmuutta ja 
mittausvirheitä, jotka vähentävät tulosten luotettavuutta tai tarkkuutta eli 
reliabiliteettia. Tämä on osittain seurausta niiden tutkimuskysymysten 
laadusta, joihin ihmistutkimuksessa haetaan vastausta. Virheitä voidaan 
vähentää niin, että jokaista tutkittavaa oletusta kysytään moneen ker- 
taan ja useammalta kantilta. Pieniksi paloitellut ja tutkimuskohdetta 
monipuolisesti mittaavat kysymykset lisäävät toistoa (redundanssi), joka 
puolestaan lisää tulosten luotettavuutta. Mittaus saadaan näin vankem- 
maksi, eivätkä tulokset ole kiinni yksittäisistä kysymyksistä. Reliabilitee- 
tin rinnalla on muistettava huolehtia tutkimusasetelman ja kysymysten 
validiteetista eli siitä, mitataanko sitä, mitä on tarkoitus (ks. Johdannon 
luku 2 tk.). 

Tutkimusasetelman suunnittelun ja lomakkeen kysymysten raken- 
tamisen tulee olla kiinteässä yhteydessä tutkimuksen taustalla vaikutta- 
vaan teoreettiseen viitekehykseen. Mikä tahansa tutkimusasetelma ei ole 
teoreettisesti validi, eikä mikä tahansa tutkimuskohteeseen jotenkuten 
liittyvä kysymys ole tieteellisesti toimiva mittari. Tieteelliseen ajatteluun 
(ks. Johdannon luku 2 tk.) sitoutunut tutkimusasetelma eroaa iltapäivä- 
lehtien gallupeista, vaikka niissäkin kerätään ja tarkastellaan kysely- 


aineistoa. Jostain syystä juuri kyselytutkimusten kohdalla on kiinnitetty 
huomiota heikkoon keskusteluyhteyteen muun tutkimuksen kanssa 
(Hirsjärvi, Remes & Sajavaara 2009, 195). Mitään periaatteellista syytä 
pinnallisuudelle ei pitäisi olla; kysely menetelmänä on yhdisteltävissä 
hyvin monenlaisiin teoreettisiin viitekehyksiin. Voi tosin olla, että ai- 
neiston keruu ja mittaaminen vievät kyselyissä enemmän aikaa kuin 
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muiden menetelmien kohdalla, eikä tutkijalla riitä aikaa analyysin sy- 
ventämiseen tai teoreettisiin pohdintoihin. Voi myös olla helppoa in- 
nostua jostain kielen ilmiöstä, tehdä ad hoc -kysely ja saada hauskoja 
tuloksia. Ilman vankkaa taustateoriaa tuloksilla on kuitenkin riski jäädä 
ohuiksi, kertaluontoisiksi ja kielitieteellisen keskustelun ulkopuolelle 
(ks. Johdannon luku 1 tk.). 


Tutkimuksemme on validi: mittarimme mittaa sitä, mitä on tar- 
koituskin. Tutkittavien tunnesanojen valikoima tulee aiemmasta 
psykologisesta tutkimuksesta ja lomakkeen kysymykset hieman 
muokattuina kielentutkimuksesta. Tuloksemme keskustelevat 
suoraan aiemman alkusanakielestä tehdyn tunnesanatutkimuk- 


sen kanssa. 


Kandidaatintutkielmaa tai pro gradua tekevän on jo ajankäytöllisesti 
järkevää sitoa opinnäytteensä vakiintuneeseen teoriaan tai tutkimus- 
suuntaukseen, jonka pohjalle kysely rakennetaan. Kannattaa harki- 
ta, lähteekö tutkimaan sellaista, mitä kukaan ei ole ennen tutkinut. 
Tutkimuskirjallisuudesta voi löytyä valmiita johonkin teoriaan sitoutu- 
neita kyselylomakkeita, joita hyödyntää jopa sellaisenaan. On huomat- 
tava, että joskus jossain ajassa ja paikassa hienosti toiminut kysely ei 
ehkä enää toimikaan. Aikanaan hyvinkin käytetty tutkimusmittari vaatii 
ennen pitkää päivittämistä. Siinä missä kandin tai gradun tekijä välttää 
metodologisia kokeiluja, väitöskirjantekijä keksii uuden mittarin tai kor- 
jaa vanhaa. Tutkimusprosessi keskustelee silloin aiemman tutkimuksen 
kanssa myös metodologian tasolla. 

Tutkimuksen suunnitteluvaiheessa pyritään ennakoimaan ja kuvit- 
telemaan tutkimuksen eri vaiheet. Tutkimuskysymys määrää suunnan 
sille, mitä ollaan tekemässä. Kaikkea ei kuitenkaan voi ennakoida. Tämä 
on odotuksenmukaista yllätyksellisyyttä ja osa tutkimusprosessin kul- 
kua. Prosessin kuluessa aineisto saa tehdä oman osuutensa. Joskus tut- 
kimuskysymystä joudutaan tarkentamaan ja jopa muuttamaan kesken 
tutkimusprosessin. Matkan varrella voi herätä jokin metodologiaan tai 
analyysiin liittyvä idea, jolle kehitellään jälkikäteen tutkimuskysymys. 
Tällaisessa ei sinänsä ole mitään tuomittavaa. On päinvastoin tylsää ja 


252 ULLA VANHATALO JA KIMMO VEHKALAHTI 


jopa vaarallista tehdä niin etukäteen määrättyä tutkimusta, että kaikki 
hypoteesit on päätetty etukäteen ja aineisto kerätään vain vahvistamaan 
hypoteesia. 


3.2. Kyselylomakkeen laatiminen 


Kyselylomakkeen laatiminen on kyselyn tärkein vaihe. Tarkastelemme 
tässä luvussa lomakkeen laatimiseen liittyviä taustatekijöitä, yksittäisten 
kysymysten sisältöä ja rakennetta, kysymysten asettelua lomakkeessa 
sekä vastausohjeita. 

Tutkijan omat ennakkokäsitykset ja kielitaju vaikuttavat aina siihen, 
miten tutkimushypoteesit muodostetaan ja millaisia kysymyksiä lo- 
makkeeseen tehdään (Itkonen & Pajunen 2010; Kielitaju kielentutkijan 
työkaluna tk.). Kyselykään ei siis koskaan ole neutraali ja objektiivinen 
tutkimusasetelma (ks. Johdannon luku 2 tk.). Tutkijan tulee pyrkiä tie- 


dostamaan tämä niin lomaketta laatiessaan kuin myös tuloksia kirjates- 
saan. Tässä auttaa avoimuus kriittiselle keskustelulle sekä tutkimuksen 
huolellinen valmistelu. 

Prosessiin liittyy erilaisia häiriötekijöitä myös vastaajan puolelta. Vas- 
taaja ei välttämättä keskity vain kyselyyn vaan tekee samalla muutakin: 
vastaa puhelimeen, juttelee muiden kanssa tai selaa nettiä — ja ehkäpä 
juuri kyselyyn liittyviä sivuja. Tutkija voi onneksi varautua myös tähän. 
Kysymysten pitää olla lyhyitä ja helppoja, ja niitä pitää olla riittävän pal- 
jon (ks. Tieteen termipankki sv. redundanssi). Vastaaja voi myös halu- 
ta näyttää fiksulta ja alkaa pohtia, mitä hänen odotetaan vastaavan (ks. 
Tieteen termipankki sv. sosiaalisen suotavuuden vastaustaipumus), kun 


taas tutkija tarvitsee vain rehellisen vastauksen. On siis hyvä, jos lukui- 
sat yllättävistä kulmista asiaa lähestyvät kysymykset ”sekoittavat” vastaa- 
jan. Vastaajan ei tarvitse ymmärtää tutkimuksen kokonaisuutta, sillä se 
on tutkijan tehtävä. Vastaajan tulee vain vastata kuhunkin kysymykseen. 

Yksittäisten kysymysten sisältö ja rakenne määräytyvät tutkimus- 
aiheen mukaan. Mittausmallin oikean puolen laatikot kertovat, mitä 
vastaajilta on kysyttävä, jotta saadaan vastauksia tutkimuskysymyksiin. 
Kysymysten on oltava paitsi lyhyitä myös yksiselitteisiä, eivätkä ne saa 
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johdatella vastaajaa. Kysymysten strukturoituneisuuden aste ja vastaus- 
vaihtoehdot (ml. täytevaihtoehdot, Likert-asteikot) vaikuttavat suoraan 
siihen, miten tuloksia voidaan analysoida. Perussääntönä voidaan ehkä 
pitää sitä, että avoimia vastauksia tulee välttää, jos aineistoa tullaan ana- 
lysoimaan tilastollisilla menetelmillä. Toisaalta on muistettava, että avoi- 
met vastaukset voivat tuottaa erittäin kiinnostavaa laadullista aineistoa. 

Kaikki kysymykset eivät ole ehkä yhtä tärkeitä tutkijan näkökulmasta. 
Tärkeät kysymykset vastauksineen voidaan jälkikäteen tarvittaessa poi- 
mia erikseen tarkasteltavaksi. Lomakkeessa voi olla yhteensä kymmeniä 
lyhyitä kysymyksiä tai väittämiä, joten turhat kysymykset olisi hyvä jät- 
tää jo etukäteen pois. Tässä voi olennaisesti auttaa pilotti, jota käsitte- 
lemme tuonnempana. Vastaajien taustatiedot (esim. äidinkieli tai ikä) 
ovat tärkeitä tutkimuksen tulosten esittelyssä ja yleistämisessä (ks. luku 
3.5.). Tutkija voi myös haluta analysoida tuloksia joidenkin taustatieto- 
jen mukaan. Kysymyksistä ja niiden muotoilusta kannattaa keskustella 
seminaariryhmässä tai muiden tutkijoiden kanssa. 

Tutkimuksen esittely vastaajille ja vastausohjeet tulee miettiä huolel- 
lisesti. Tutkimusaiheen esittelyn tulee olla lyhyt ja yleistasoinen. Vas- 
taaja olisi kuitenkin saatava vakuuttumaan siitä, että kyselyyn kannattaa 
osallistua ja tehdä se loppuun. Alussa on luvattava, että vastaamisen 
voi halutessaan jättää kesken, ja lopussa tavalla tai toisella saatava vas- 
taajan suostumus aineiston käyttöön tutkimustarkoituksessa (engl. 
consent form). Vastausohjeiden on oltava lyhyitä ja täysin yksiselitteisiä. 
Sekä esittelytekstistä että ohjeista kannattaa pyytää palautetta pilottiin 
osallistuvilta. 

Huomioon on otettava myös kysymysten asettelu (yksi vai useampi 
sivulle), järjestys lomakkeessa (mihin on helppoa vastata aluksi, vai- 
kuttavatko aiemmat kysymykset tulevien vastauksiin), esitysjärjestyk- 
sen satunnaistaminen (voi olla niin hyötyä kuin haittaa) ja lomakkeen 
pituus (kauanko vastaajalla menee aikaa — tässä on syytä olla realisti- 
nen, jottei aliarvioi vastaamiseen kuluvaa aikaa!). Sijoittamalla tausta- 
tietokysymykset sisältökysymysten jälkeen kyselyn loppuun vältetään 
kuulustelumaisuus lomakkeen alkupäässä. Vastaajan kannalta on hyvä, 
jos lomakkeessa näkyy kyselyn kulku ja jäljellä olevien kysymysten tai 
sivujen määrä. 
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Kaikki kysymykset ja ohjeet kannattaa suunnitella teksti- tai taulukko- 
tiedostossa, eikä lomakeohjelmaa tule ottaa käyttöön ennen kuin kaikki 
kysymykset tuntuvat valmiilta. Kysymysten muokkaaminen lomake- 
ohjelmassa voi olla hyvin hidasta ja hankalaa. Täysimittainen sähköinen 
lomake pilottitutkimusta varten kannattaa tehdä vasta sitten, kun on 
varma kysymysten muotoiluista ja järjestyksestä. 

Lomakeohjelman valinnassa kannattaa ottaa huomioon paitsi lomak- 
keen tekniset ominaisuudet (etenkin toimivuus eri laitteilla ja selaimilla) 
myös käyttäjätuki. Lomakeohjelman automaattiasetuksista voi olla hyö- 
tyä tai haittaa selkeän lomakkeen aikaansaamisessa. Oman instituution 
käyttämä lomakeohjelma voi puutteistaan huolimatta olla järkevä valin- 
ta, jos tarjolla on käyttäjätukea niin suunnittelussa kuin myös mahdol- 
lisen katastrofin sattuessa. 

Kun lomake on tutkijan mielestä lopulta valmis, on aika tehdä esi- 
pilotti. Esipilotissa muutama tutkijan valitsema henkilö täyttää lomak- 
keen verkossa ja raportoi havainnoistaan. Lomaketta testataan myös 
erilaisilla etenkin kannettavilla päätelaitteilla. Kun esipilotissa mah- 
dollisesti ilmenneet ongelmat on korjattu, voidaan siirtyä varsinaiseen 
pilottiin. Sen tehtävänä on näyttää, toimiiko tutkimusasetelma aineis- 
tonkeruusta aina analyysiin asti niin kuin on ajateltu. Pilottiin riittää 
tyypillisesti 10-15 vastaajaa, jotka parhaassa tapauksessa vastaavat tausta- 
profiililtaan varsinaiseen tutkimukseen osallistuvia. Pilottiin osallistu- 
vilta kannattaa myös kysyä kokemuksia lomakkeesta. Pilotin jälkeen 
voidaan vielä tehdä muutoksia lomakkeeseen, mutta kun varsinainen 
aineistonkeruu alkaa, muutosten tekeminen ei enää ole mahdollista. 


Alussa tahdomme tehdä mahdollisimman lyhyen kyselyn ja yksin- 
kertaisia kysymyksiä. Näin suunnittelemme: 


”En tiedä, mitä kohta tapahtuu. Voi tapahtua pahoja asioita. En 
tiedä, mitä voin tehdä. Se tuntuu minusta pahalta.” 


Mistä tunteesta on mielestäsi kyse? Kerro vastauksesi lyhyesti. 


(Odotamme vastaukseksi sanaa pelko.) 


LUKU 2 KYSELY 255 


Tilastotieteilijä kyseenalaistaa suunnitelmamme liian yksinkertai- 
sena ja häiriötekijöille alttiina. Asetelma ei ole riittävän luotettava, 
koska siitä puuttuu redundanssia. Lisäksi avointen vastausten ana- 
lyysi on hankalaa. Lisäämme kysymysten määrää ottamalla mu- 
kaan merkitysten selitysten osakomponentit. Luovumme avoimis- 
ta vastauksista ja annamme vastaajalle listan, josta ruksia sopivat 
tunnesanat. Päätämme hämätä vastaajaa laittamalla listalle myös 
seitsemän täytesanaa. Pilottipalautteen jälkeen lisäämme listan 
loppuun myös vaihtoehdot en osaa sanoa ja jokin muu, mikä? 


Näin teemme: 
”minusta tuntuu pahalta” 


Mihin tunteeseen tämä mielestäsi liittyy? Merkitse rastilla yksi tai 
useampi vaihtoehto. 


oO ahdistus 
hämmästys 


häpeä 
ilo 


inho 


kateus 


onnellisuus 
pelko 


rakkaus 
riemu 


suru 

tyytyväisyys 

viha 

ylpeys 

en osaa sanoa 
jokin muu, mikä? 
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Jokaista tunnesanaa mittaa nyt monta kysymystä. Toisaalta osa 
kysymyksistä mittaa nyt useampaa tunnesanaa, kun esimerkiksi 
minusta tuntuu pahalta kuuluu niin surun kuin vihan selityksiin. 
Vastauksiksi saamme lähes pelkkiä rasteja. Hylkäämme ajatuksen 
merkityskomponenttien intensiteetin mittauksista liukuvalla astei- 
kolla liian mutkikkaana analysoitavana. 


33 monivalintakysymyksen jälkeen teemme vielä muutaman kään- 
nöskysymyksen: Miten sanoisit suomeksi: I’m happy. / I’m angry jne. 
Taustatiedoista kysymme syntymävuotta, sukupuolta, ensikieltä ja 
mahdollisia kieliaineiden tai psykologian opintoja ja sitä, minkä 
kurssin yhteydessä kyselyyn on osallistuttu. 


Tavoitteemme on saada vastaaja vastaamaan nopeasti sen, mitä 
mieleen tulee. 


Haluamme kysymykset satunnaiseen järjestykseen, mutta emme 
halua kokonaisia selityksiä aivan lomakkeen alkuun. Käyttämäm- 
me lomakeohjelma ei taivu kysymysten satunnaiseen esitysjärjes- 
tykseen, joten huolehdimme siitä erillisellä ohjelmalla. Kysymysten 
muokkausvaiheessa teemme myös ensimmäisen esipilottilomak- 
keen e-lomakepohjaan. Lyhyt esipilottilomake sisältää mallisivut 
kaikista kysymystyypeistä. Testailemme minilomaketta eri tieto- 
koneilla ja kännyköillä. 


Tässä luvussa olemme tarkastelleet lomakkeen laatimista. Lomakkeen 


suunnittelu ei tosiasiassa kuitenkaan rajoitu vain lukuun 3.2., vaan kos- 


kee mitä suurimmassa määrin myös analyysia (luku 3.4.). Suunnitte- 


luun vaikuttavat myös julkaisukanavan asettamat rajoitukset esimerkiksi 


merkkimäärälle, taulukoille ja kuville. 
Lomakkeen suunnittelun tärkeyttä ei voi liiaksi korostaa. Kun mit- 


taukset on lopulta tehty, tutkijalla on joukko numeroita (ja mahdollisia 
avoimiin kysymyksiin tulleita vapaamuotoisia vastauksia). Koko tutki- 


mus riippuu tämän jälkeen näistä numeroista, joita ei voi enää uusia 


ilman uutta mittausta. Mikään analyysimenetelmä ei pelasta huonosti 
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tehtyä mittausta. Tämä on koko kyselymenetelmän käytön tärkeimpiä 
huomioita. 


Tapaustutkimuksemme pilotissa on 16 vastaajaa. Tulosten alustava 
analyysi näyttää hyvältä. Pilotin perusteella lisäämme mahdollisuu- 
den antaa myös avoin muu, mikä? -vastaus rastien lisäksi. Sovim- 
me kuitenkin, ettemme analysoi tuon kysymyksen vastauksia tätä 
tutkimusta varten." 


3.3. Aineiston keruu eli vastaajien tavoittaminen 


Aineiston keruuseen liittyy kaksi pääkysymystä, joihin kielentutkijan 
on itselleen vastattava: 1) kenen käsityksiä kielestä haluan tutkia ja 2) 
miten tavoitan nämä ihmiset. Ensimmäinen kysymys liittyy suoraan tut- 
kimusten tulosten yleistettävyyteen, toinen tutkimuksen toteuttamiseen 
käytännössä. Tarkastelemme tässä luvussa näitä kysymyksiä. 

Kyselytutkimuksen tekijän on yleensä jollakin tavalla rajattava 
kohderyhmänsä. Vain hyvin pienten kielten tutkijat voivat tehdä 
kokonaistutkimuksen ja ottaa kohderyhmäänsä kaikki tutkimansa 
kielen puhujat. Vastaajajoukon valintaan on kaksi päätapaa: satun- 
naisotanta ja harkinnanvarainen näyte. Otanta on tilastotieteen näkö- 
kulmasta (verrattain harvinaisen kokonaistutkimuksen lisäksi) tär- 
kein aineiston keruutapa, koska siinä tulokset on mahdollista yleistää 
laajempaan kohdejoukkoon. Käytännössä moni kielitieteen tutkimus 
perustuu kuitenkin harkinnanvaraiseen näytteeseen eli jostakin (pa- 
remmin tai huonommin) perustellusti valitusta ihmisryhmästä ke- 
rättyyn aineistoon. Vastaajajoukon voi muodostaa esimerkiksi jokin 
opiskelijaryhmä. 

Aineiston keruutavalla on suuri merkitys kyselyn tulosten tulkin- 
nassa, ja siksi tutkijan on osattava tehdä selvä ero satunnaisotannan 
ja harkinnanvaraisen näytteen välillä. Satunnaisotannassa kaikilla pe- 
rusjoukkoon kuuluvilla on samanlaiset mahdollisuudet päätyä vastaa- 
jaksi. Tulokset ovat tällöin suoraan yleistettävissä perusjoukkoon, josta 
otos on alun perin poimittu ja jota otos edustaa. Harkinnanvaraiseen 
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näytteeseen on jollain perusteella valittu tietty joukko vastaajia, eikä tu- 
loksia lähtökohtaisesti pystytä yleistämään vastaajajoukon ulkopuolelle. 

Kun esimerkiksi suomen kielen tutkija haluaa saada kaikkiin Suo- 
messa asuviin äidinkielisiin suomen puhujiin yleistettäviä tuloksia, 
hän pyytää Väestörekisterikeskuksesta 2 ooo hengen satunnaisotannan 
äidinkielenään suomea puhuvista kansalaisista. 2 000 vastaajaa on Suo- 
messa tyypillinen määrä, jossa kustannukset eivät nouse liian suuriksi ja 
otoskoko riittää päteviin tuloksiin. Tutkija lähestyy kohdejoukkoaan ky- 
selyllä, hankkii vastaukset ja analysoi tulokset. Satunnaisotantaan liittyy 
kuitenkin epävarmuustekijöitä. Väestörekisterikeskus ei välttämättä näe 
perusteita tietojen luovuttamiseen kyseistä tutkimusta varten. Vaikka 
yhteystiedot saisikin, vastausprosentti voi jäädä pieneksi, kato voi kasvaa 
suureksi ja korjaava aineistonkeruu osoittautua työlääksi. Jos samaiselle 
tutkijalle riittää tulosten yleistäminen esimerkiksi Helsingin yliopiston 
humanistisen tiedekunnan opiskelijoihin, hän voi pyytää tiedekunnan 
kaikkien opiskelijoiden yhteystietoja, tehdä näistä satunnaisotannan ja 
pyytää valittuja osallistumaan tutkimukseen. Ongelmat ovat samat kuin 
edellä mutta pienempinä. (Laaksonen 2013; Vehkalahti 2019.) 

Otannan sijaan tutkija voi päättää kerätä harkinnanvaraisen näytteen, 
johon kuuluu jokin joukko ihmisiä, esimerkiksi tietyn luentokurssin 
osallistujat. Näyteaineiston keräämiseen päädytään usein silloin, kun 
tavoitteena on saada tutkijan kielitajua vahvistavaa alustavaa käsitystä 
tutkittavasta ilmiöstä. Näyteaineistoa voivat puoltaa aikataulusyyt: näyte 
on usein huomattavasti nopeampi kerätä kuin satunnaisotanta. Näyte- 
aineisto mahdollistaa myös kontrolloidut kyselyolosuhteet esimerkiksi 
luokkahuoneessa. Näytetutkimus voi toimia pilottina myöhemmin teh- 
tävälle satunnaisotantaan perustuvalle tutkimukselle, jolloin satunnais- 
otanta kerätään vasta sitten, kun näytteellä on saatu riittävän lupaavia 
tuloksia (ns. lumipallonäytteenotto). Näyteaineistoon saadaan uskotta- 
vuutta ja syvyyttä, kun se kohdennetaan johonkin ryhmään ja riittävillä 
taustakysymyksillä varmistetaan, että vastaajat kuuluvat riittävän vah- 
vasti ko. ryhmään. Esimerkiksi jos vastaajan äidinkieli on olennainen 
taustatekijä, tätä on kysyttävä lomakkeessa ja analyysivaiheessa muiden 
kielten puhujat on poistettava aineistosta. (Laaksonen 2013; Vehkalahti 
2019.) 
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Kielentutkimuksessa ei välttämättä ole aina ymmärretty aineiston- 
keruutavan ja yleistettävyyden kiinteää yhteyttä, ja yleistämään pyr- 
kiviä tutkimuksia on tehty näyteaineistojen perusteella. Esimerkiksi 
Tummers, Heylen & Geeraerts (2005, 229—230) esittävät kyselyn (engl. 
survey) kollektiivisen introspektion muotona. He kiinnittävät huomiota 
observoijan paradoksiin ja kyselyn kontekstisidonnaisuuteen mutta eivät 
puhu mitään otoksesta, näytteestä tai yleistämisen ongelmista. Empii- 
risesti kerätyn aineiston semanttisia muuttujia mainitaan kyllä analy- 
soitavan impressionistisesti, ja todellisten määrällisten menetelmien 
todetaan puuttuvan (mts. 248—249). Samoihin aikoihin ilmestyneessä 
Pohjois-Amerikan englannin fonologisessa atlaksessa (Labov, Ash & 
Boberg 2006) aineistonkeruuseen ja sen raportointiin on paneuduttu 
huolellisesti; tosin tässäkään tapauksessa ei ole kyse otannasta. 

Metodologiselta kannalta yleistämiseen sisältyy aito ongelma. Tar- 
jolla on kaksi ratkaisua: näyteaineistolla saatuja tuloksia 1) ei yleistetä 
vastaajajoukon ulkopuolelle, tai 2) ne yleistetään (johonkin, mihin?), 
mutta yleistäminen perustellaan muilla tutkimuksilla tai tutkijan muul- 
la tietämyksellä asiasta. Ensimmäinen vaihtoehto voi kuulostaa tylsältä 
muttei todellakaan ole sitä. Uusi tieto kielestä on aina arvokasta. Tutkija 
voi pohdintaosuudessa toki tehdä yleistyksen suuntaan meneviä hypo- 
teeseja. Joskus tieto normista ja selvistä tapauksista voi oikeuttaa yleis- 
tämisen näytteestä koko puheyhteisöön, mutta tällaisiin tapauksiin ei 
juuri kyselyä tarvita. Vaarallisinta on tehdä metodologisesti ei-sallittuja 
yleistyksiä oman kielitajun varassa tiedostamatta, mitä tekee. 

Perustava ero otoksen ja näytteen välillä on se, että otoksen kohdalla 
tiedetään perusjoukko ja sen perusteella se, kenen piti vastata (eli ketkä 
valittiin otokseen), ketkä näistä vastasivat ja ketkä eivät. Näytteessä tiede- 
tään (olettaen, että tietoa kysyttiin) vain se, ketkä vastasivat, mutta ei sitä, 
ketkä eivät vastanneet. Otoksessa kaikkien perusjoukkoon kuuluvien on 
yhtä todennäköistä päätyä mukaan tutkimukseen. Yleistämisen kannalta 
olennainen satunnaisuus on silloin tutkijan hallussa, ja sen mekanismit 
tunnetaan. Voidaan arvioida, onko kato aiheuttanut harhaa: edustavatko 
vastaamatta jättäneet perusjoukkoa vai muodostavatko he jonkin erityis- 
ryhmän? Jälkimmäisessä tapauksessa vastaamatta jättäminen voi olla 
tulosten tulkinnan kannalta olennaista. 
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Kielentutkijaa kiinnostaa usein se, paljonko tutkimuksessa pitäisi olla 
vastaajia. Ennen kuin tähän voidaan vastata, on tiedettävä, onko kysees- 
sä satunnaisotanta vai harkinnanvarainen näyte. Satunnaisotannassa 
vastaajien määrä riippuu ennen muuta hyväksytystä virhemarginaalista 
ja ennakoidusta vastausprosentista. Näytekeruussa asiaan vaikuttavat 
tutkittava ilmiö ja se, halutaanko vastauksia analysoida taustamuuttujien 
suhteen. Tutkimuskohteesta riippuen pienikin vastaajamäärä voi hyvin 
riittää. Aiempien tutkimusten tarkastelu voi auttaa: Millaisia kysely- 
asetelmia tiedeyhteisö on aiemmin hyväksynyt julkaistavaksi? Onko 
tietyillä tieteellisillä julkaisuilla omia suosituksia esim. näyteaineiston 
koosta? Yhdysvaltojen vaaliesimerkki kertoo, että pelkkä suuri vastaajien 
määrä ei tee tutkimuksesta luotettavaa (ks. luku 1.1.). 

Vastaajien tavoittaminen voi olla tutkimuksen pullonkaula sekä 
otoksessa että näytteessä. Miksi vastaaja kiinnostuisi juuri kyseisestä 
kielentutkimuksen kyselystä, kun verkko on täynnä erilaisia kyselyjä? 
Vastaamishalukkuutta voi toisinaan lisätä some-näkyvyydellä, houkut- 
televalla tutkimusaiheella tai vastaajan palkitsemisella, kunhan tähän 
liittyvät riskit (esim. vastaajan anonymiteetin säilyminen) on otettu 
huomioon. Tutkija voi rahoituksen niin salliessa tilata aineiston- 
keruun myös alan yritykseltä. Siinä tapauksessa on otettava huo- 
mioon, että yritykset tekevät yleensä ns. kiintiöpoimintaa. Se tarkoittaa 
sitä, että tietyiltä alueilta kerätään vastaajakiintiöt täyteen. Kieltäytyjien 
määrät tai taustaprofiilit eivät ole tiedossa. Tutkija voi käyttää myös 
verkossa toimivia vastaamisen puoliammattilaisia (engl. mechanical 
turks), jotka ovat sitoutuneet vastaamaan erilaisiin kyselyihin pientä 
korvausta vastaan. Yleistettävyyden kannalta kiintiöpoiminta tai am- 
mattivastaajat ovat parempi kuin näyte, mutta satunnaisotantaa ne 
eivät vastaa. 

Keskustelu verkossa ja paperilla tehtävän kyselyn hyödyistä on käytän- 
nössä ratkaistu verkon hyväksi (ks. esim. Laaksonen, Matikainen & Tik- 
ka 2013; Valli & Perkkilä 2015). Paperikysely eri vaiheineen on hidasta ja 
kallista. Verkkokyselyn haittatekijöitä voidaan vähentää kohdentamalla 
kyselyitä. Näyteaineisto voidaan kerätä verkkokyselyllä myös valvotuissa 
olosuhteissa esimerkiksi luennolla tai koululuokassa. 


LUKU 2 KYSELY 261 


Keräämme aineiston kolmesta opetusryhmästä Helsingin yli- 
opistolta. Ryhmämme ottaa yhteyttä luennoitsijoihin ja saa luvan 
käyttää keruuseen 20 minuuttia luentoaikaa. Tutkijamme menee 
paikalle, esittelee lyhyesti keruun ja seuraa tilannetta. Keruun 
jälkeen osallistujille tarjotaan tutkimuksen esittely kirjallisena. 
Saamme yhteensä 147 vastausta, joista 130 ilmoittaa äidinkielek- 
seen suomen. 


3.4. Pilottiaineiston analyysin vaikutus lomakkeen 
suunnitteluun 


Tässä analyysia käsittelevässä luvussa nostamme esiin seikkoja, jot- 
ka ovat olennaisia lomakkeen suunnittelun kannalta. Kyselyaineiston 
analyysimahdollisuuksista on runsaasti kirjallisuutta, johon kannattaa tu- 
tustua jo lomaketta suunnitellessa (esim. Gömez 2009; Greenacre 2017; 
Gries 2013; Hand 2004; Johnson 2008; Luojola 2006; Stigler 2016). 

Aineiston analysointi liittyy vahvasti jo lomakkeen suunnittelu- ja pi- 
lotointivaiheeseen. Lomakkeen jokaiseen kysymykseen liittyy suoraan 
suunnitelma siitä, miten odotettavissa oleva vastaus analysoidaan — ja 
miten analyysin tuloksella vastataan tutkimuskysymykseen. Lopullisen 
aineiston analyysin onnistumisen kannalta on tärkeää, että pilotointi- 
vaihe on ulotettu myös pilottiaineiston analyysiin ja analyysissa mahdol- 
lisesti ilmenneet lomakkeesta aiheutuneet ongelmat on korjattu ennen 
varsinaista keruuta. 

Kyselymenetelmä tuottaa tyypillisesti ison määrän aineistoa, josta 
kielentutkijan tulee löytää tutkimuskysymyksensä kannalta olennainen 
tieto. Tässä auttavat tilastolliset mallit ja menetelmät. Liian ”hienoja” tai 
monimutkaisia tilastollisia menetelmiä kannattaa välttää etenkin, jos 
ei ole varma niiden sopivuudesta kyseiseen tutkimukseen. Yksinkertai- 
set perusmenetelmät ovat hyviä, koska niiden tulokset ovat useamman 
ymmärrettävissä. Kuvien piirtäminen on tärkeää, ja esimerkiksi prosen- 
tuaalisista laskelmista voi jo päätellä paljon. Laskennan pitää olla intui- 
tiivisesti selvää ja pysyä lähellä ilmiötä. Kaikessa numeroiden yhdistä- 
misessä tulee olla tarkkana. Liian tiivistetyt tulokset voivat hävittää niin 
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paljon yksityiskohtia, etteivät ne enää kerro ilmiöstä sitä, mitä niiden oli 
tarkoitus kertoa. 

Kielentutkijan työpöydän yläpuolelle kiinnitetty mittausmallin tuloste 
(ks. kuva 1) pysyy tutkijan apuvälineenä myös analyysin suunnittelus- 
sa. Vasemman laidan ympyröiden havainnot muistuttavat siitä, mistä 
lähdettiin liikkeelle ja minkä perusteella luotiin tutkimuskysymykset. 
Jos tämä unohtuu, analyysivaiheessa tutkija voi innostua numeroista, 
jotka eivät välttämättä vastaakaan tutkimuskysymyksiin. Alkuperäisen 
mittausmallin viereen kannattaa tulostaa uusi kuva, jossa näkyy tutki- 
muksen kasvaminen tulosten suuntaan. 

Alkuperäinen mittausmalli laajenee nyt oikeasta laidastaan mittaus- 
kehikoksi, johon tulee salmiakkikuvioita ja muita käsitteitä. Keskelle 
mitta-asteikoksi kehittyvät salmiakit vastaavat tyypillisesti vasemman 
laidan ympyröitä. Mitta-asteikon vasemmalle puolelle jää siis alku- 
peräinen mittausinstrumentti eli kyselylomake. Laatikot eli lomakkeen 
kysymykset ovat kuin peilejä, jotka kertovat jotain tutkittavasta kielen 
ilmiöstä. Analyysivaiheessa saatetaan huomata, että lomake toimiikin 
kuin Linnanmäen Naurutalon peili: se muistuttaa kuvaamaansa ilmiötä 
mutta yksinkertaistaa, vääristää tai muulla tavoin tulkitsee todellisuutta 
osin yllätyksellisesti. 

Yksinkertaisimmillaan aineiston analyysi on tiivistämistä eli aggre- 
gaatiota, mihin viittaavat myös mittauskehikon asteikot, joihin tullaan 
suoraan alkuperäisestä aineistosta. Aggregaatio on ilmiön tuntemuk- 
seen perustuva yksinkertaistus, jota on kaikkien tilastollisten mallien 
ytimessä (Stigler 2016). Oletus on se, että tuloksista pitäisi löytyä paljon 
tietynlaisia vastauksia, jotka voidaan yhdistää ja vaikkapa esittää visuaa- 
lisesti suhteellisen selvinä kokonaisuuksina. 

On huomattava sekin, että jokin kysymys voi vastata ehkä yllättäen 
johonkin piilevään seikkaan, vasemman laidan pieneen ympyrään, jota 
tutkija ei edes lähtenyt tutkimaan. On myös mahdollista, että vielä ai- 
neiston analysoinnin myötä havaitaan tarve jollekin uudelle ympyrälle 
eli ulottuvuudelle, jota ei tultu alun perin ajatelleeksi. Tutkijan on mah- 
dollista työstää ajatustaan tutkittavasta ilmiöstä myös analyysin edetessä. 
Tällöin on kyseessä enemmän eksploratiivinen eli aineistopohjainen tut- 
kimus kuin sen vastakohta, konfirmatorinen eli malleja ja hypoteeseja 
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Mittausmalli Mitta-asteikko 
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Kuva 2. Mittauskehikko kokonaisuudessaan (Vehkalahti 2019, 122). 


varmentava tutkimus. Käytännössä erilaiset tutkimusasetelmat asettuvat 
jonnekin näiden kahden vaihtoehdon välille. 

Mittauskehikossa edetään siis vasemmalta oikealle. Useimmiten 
välttämättömän aineiston tiivistämisen myötä päästään lähemmäksi 
tutkimuskysymyksiä, kun voidaan operoida laatikoiden eli yksittäisten 
kysymysten sijaan ympyröitä vastaavilla salmiakeilla eli vastauksien tii- 
vistetyillä yhdistelmillä. Yhteiskunta- ja käyttäytymistieteiden kyselyissä 
tyypillisin keino aineiston alkuvaiheen tiivistämiseen on faktorianalyysi 
(Vehkalahti 2019, 93-111), mutta vastaavaa tiivistystä voidaan tehdä 
yksinkertaisemminkin, esimerkiksi laskemalla muuttujia yhteen (mts. 
112-116). 

Tästä eteenpäin vaihtoehtoisia etenemistapoja on paljon. Analyysei- 
hin voidaan ottaa mukaan kaavion ulkopuolisia taustatekijöitä, kuten 
vastaajien sukupuoli, ikä ja äidinkieli. Yhden muuttujan tarkastelut, ku- 
ten kuvien piirtäminen ja tunnuslukujen tulkitseminen, ovat aina mie- 
lekkäitä tapoja aloittaa. Seuraava taso on tarkastella kerralla kahta muut- 
tujaa yhtaikaa. Tiivistettyjä vastauksia voidaan esimerkiksi taulukoida 
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ristiin taustamuuttujien kanssa ja piirtää vaikkapa pylväskuvia. Aineis- 
ton alkuvaiheen tiivistäminen on tärkeää, koska se helpottaa analysoin- 
tia olennaisesti. Analysointi olisi huomattavan paljon työläämpää alku- 
peräisillä kysymyksillä, koska niitä on yksinkertaisesti liikaa. Mittauksia 
ei valitettavasti ole mahdollista suorittaa valmiiksi tiivistetysti; se johtaisi 
epäselvyyksiin ja väärinymmärryksiin. 

Hieman pidemmälle menevistä tyypillisistä menetelmistä mainit- 
takoon regressioanalyysi (Vehkalahti 2019, 124-150), jossa yhtä muut- 
tujaa pyritään selittämään useilla muilla. Mittauskehikossa selittäjinä 
toimivat erilaiset tiivistetyt asteikot ja selitettävänä toimii jokin vertailu- 
perusteeksi kutsuttu erillinen tekijä (kuvassa 2 ”y”). Tulokseksi saadaan 
muun muassa uusi tulosasteikko (regressioanalyysin tuottama ennuste, 
kuvassa 2 ”z”), jonka pohjalta voidaan tehdä johtopäätöksiä analyysin 
onnistumisesta. Analyysin jäännös- eli residuaalivaihtelu ja sen visuali- 
sointi avaavat puolestaan näkymiä siihen, kuinka hyvin regressiomalli 
toimii, miten sen erilaiset oletukset täyttyvät aineiston perusteella ja 
mitä mahdollisia lisäpäätelmiä aineiston ja mallin pohjalta voisi vielä 
tehdä. Vastaavia analyysimenetelmiä on lukuisia, ja ne toimivat pitkälti 
samoilla periaatteilla. (Perusmenetelmistä tarkemmin ks. esim. Vehka- 
lahti 2019.) 


Esimerkkitutkimuksessamme oikeiden ja väärien vastausten mää- 
rien tarkastelu antaa ns. ensimmäisen asteen tuloksia. Oikeiden 
vastausten lisäksi aineistossa on paljon vääriä vastauksia, joissa on 
lukuisia tapoja ”ei-tietämiselle”. Jäännösvaihtelusta saattaa löytyä 
uusia näkökulmia tutkittavaan asiaan, ja sitä kannattaa tarkastella 
ihan uteliaisuudesta. Näitä kutsutaan myös toisen asteen tuloksik- 
si. Yksi tapa analysoida aineistoa on myös tarkastella tuloksia vas- 
taajittain. Montako oikeaa ja väärää vastausta kukin vastaaja tuotti? 
Onko joukossa vastaajia, jotka vastasivat kaikki oikein? Löytyykö 
systemaattisesti oikein tai väärin vastanneille yhteisiä taustateki- 
jöitä, ja voiko tästä päätellä jotakin? 

Olemme lisänneet lomakkeeseemme kysymyksiä ja redundans- 
sia. Samalla satunnaisvaihtelun osuus tuloksissa on kasvanut. "Jo- 
kaisen sanan kohdalle on tulossa valtavan harva matriisi ykkösiä 


LUKU 2 KYSELY 265 


ja nollia. Jotenkin tuota pitäisi tiivistää ja runnoa kasaan, että sieltä 
nähtäis jotain”, sanoo tilastotieteilijä. 

Aluksi laskemme binaarisesti, montako prosenttia vastaajista on 
vastannut mihinkin kysymykseen oikein ja montako väärin. Tällä 
yksinkertaisella erottelulla saamme ns. ensimmäisen asteen tulok- 
set ja vastauksen tutkimuskysymykseemme: tunnistavatko vastaajat 
tunnesanojen alkusanakielisiä määritelmiä? Toisen asteen tuloksia 
saamme jäännösvaihtelusta. Luomme tiedoston, josta poistamme 
oikeat vastaukset. Saamme vielä edellistä harvemman matriisin, 
josta voimme tarkastella sitä, mikä on vaikkapa kolmen kärki vää- 
rissä vastauksissa per määritelmä (olettaen, että enemmistö vastaa- 
jista vastasi oikein). Näemme myös, mitä sanoja on valittu vähiten. 

Teemme jokaiselle seitsemälle tunnesanalle nämä kaksi toimen- 
pidettä. Jos voisimme luottaa siihen, että mittaus on täysin vir- 
heetön, yllä olevat tulokset riittäisivät meille. Olemme kuitenkin 
varautuneet mittausvirheisiin kasvattamalla lomakkeen redun- 
danssia osakomponenteista muodostetuilla lisäkysymyksillä. Osa- 
komponentteja emme voi tarkastella aivan samalla tavalla kuin 
kokonaismääritelmiä, koska yhtä osakomponenttia voi vastata 
useampi tunnesana. Tähän tarvitsemme vielä lisätarkasteluja ai- 
neiston äärellä. 

Teemme myös osakomponenteille primaarianalyysin eli kat- 
somme kysymys kerrallaan, moniko vastaaja on vastannut oikein. 
Tuloksia voimme myöhemmin verrata kokonaismääritelmien 
tunnistusprosentteihin. Onko kokonaismääritelmä mahdollisesti 
paremmin tai heikommin tunnistettu kuin yksittäiset merkitys- 
komponentit? Puuttuuko kyselyn pohjalla olevasta nojatuoli- 


määritelmästä jotain olennaista? 


On tärkeää, että tilastotieteilijän kanssa käydään keskustelua jo lomak- 
keen suunnitteluvaiheessa. Harmillisen usein tilastotieteilijä kutsutaan 
apuun liian myöhään, jolloin iso osa kielentutkijan tekemästä työstä 
voi joutua hukkaan. Myös opiskelijan on selvitettävä, kenen puoleen 
voi tilastoasioissa kääntyä. Lisäksi on muistettava arkijärjen käyttö. Hä- 
lytyskellojen pitäisi soida, jos kielentutkija ei lainkaan ymmärrä, mitä 
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tilastotieteilijä tekee tai käskee tehdä kieliaineistolla. Keskustelut tilasto- 
tieteilijän kanssa avaavat näkökulmia, antavat työkaluja ja varoittavat 
vaarasta, mutta vastuu prosessin ymmärtämisestä ja tulosten tulkinnas- 
ta jää aina kielentutkijalle. 

Keskustelu tilastotieteilijän kanssa voi aiheuttaa myös ristiriitoja. 
Kielentutkija voi osata käyttää Exceliä, mutta tilastotieteilijän mukaan 
sillä voi olla vaikeaa tehdä tilastollista tutkimusta, koska se ei ole siihen 
varsinaisesti tarkoitettu. Kielentutkijan pitäisi käyttää muutama viikko 
tai kuukausi esimerkiksi R:n opiskeluun”. Tavoitteista riippuen tämä 
kannattaa tai ei kannata. Exceliä kehittyneemmän työkalun opettelu voi 
kielentutkijoiden kokemusten mukaan olla alkuun hidasta, mutta kun 
systeemin oppii, käyttö voi olla todella nopeaa. Vaikka verkosta löytyykin 
kosolti hyviä neuvoja, voi aikaa vievintä silti olla erilaisten komentojen 
etsiminen tutoriaaleista tai sen keksiminen, mikä on se nappi, jota pai- 
namalla kaikki (muka!) järjestyy kuten halutaan. 


3.5. Tulosten tulkinta ja kirjoittaminen 


Tulosten tulkinnan ja kirjoittamisen vaiheessa nähdään lopulta se, on- 
nistuivatko kysymykset mittaamaan sitä, mitä alussa lähdettiin tutki- 
maan. Ovatko tulokset odotusten mukaisia vai yllättävätkö ne? Painot- 
tuvatko tulokset jotenkin? Onko jokin mittausmallin vasemman laidan 
ympyröistä tulosten perusteella kiinnostavampi kuin alussa luultiin? 
Lisäksi on muistettava kiinnittää kriittistä huomiota aineiston keruun 
kuvaukseen ja tulosten yleistettävyyteen. 

Kyselytutkimuksen raportoinnin ongelmat liittyvät usein aineiston ke- 
ruun kuvaukseen (Laaksonen 2017). Lukijalle jää toisinaan epäselväksi 
jopa se, onko kyseessä ollut otanta vai harkinnanvarainen näyte. Otan- 
nan ja näytteen eron lyhyt selvittäminen auttaisi myös lukijaa tulkitse- 
maan tuloksia. Ongelmia voi liittyä myös aivan asianmukaisesti kerätyn 
otoksen kuvaukseen: otoksen suuruutta voidaan korostaa, vaikka pelkkä 
vastaajien lukumäärä ei kerro paljoakaan, jos vastaajien suhteellinen 
määrä eli vastausprosentti jää ilmoittamatta. Ongelmista vaikeneminen 
ei aina ole tahallista, vaan kyse voi olla tiedon ja osaamisen puutteista. 
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Ongelmia ei välttämättä ole edes tunnistettu. Jos otantaan liittyvät on- 
gelmat tunnistettaisiin, osa näistä voitaisiin analyysivaiheessa oikaista. 
Esimerkiksi kadon aiheuttamia ongelmia voitaisiin korjata painotuk- 
silla tai kuvaamalla vastanneiden ja vastaamatta jättäneiden profiileja. 
Valmiiden aineistojen varaan rakentuvassa tutkimuksessa on otettava 
huomioon mittaamiseen aikanaan mahdollisesti liittyneet ongelmat. 

Yleistämiseen puolestaan liittyy usein se ongelma, että harkinnan- 
varaisella näytteellä kerätyn aineiston tulokset yleistetään koskemaan 
jotakin perusjoukkoa, vaikka ne edustavat vain sitä vastaajaryhmää, josta 
aineisto on kerätty. Yleistäminen ei ole ilmoitusasia, eikä se toisaalta 
aina ole edes tarpeen. Huolellisesti raportoidut tulokset ovat arvokkaita 
jo sellaisenaan: on saatu selvitettyä ilmiön perusasiat ja testattua laadittu 
kyselylomake käytännössä. Tiedetään, miten tulokset poikkesivat tutki- 
jan ennakkokäsityksistä. Jos näyteaineiston tuloksia yleistetään näytteen 
ulkopuolelle, yleistäminen nojaa tällöin tutkijan muuhun tietämykseen 
ja mahdollisiin muilla menetelmillä kerättyihin aineistoihin. On myös 
tärkeää muistaa, että kyselyssä vastaajalta saatu tieto ei välttämättä vastaa 
sitä, mitä vastaaja tuottaisi spontaanissa kielenkäyttötilanteessa. 

Mitään ei pystytä mittaamaan täysin virheettömästi. Tämä ei kuiten- 
kaan estä uuden tiedon saavuttamista. Eettisesti toimiva kielentutkija on 
tietoinen kyselyynsä liittyvistä ongelmista, pyrkii niiden totuudenmukai- 
seen raportointiin, osoittaa tulostensa yhteydet aiempaan tutkimukseen 
ja käy näin keskustelua tiedeyhteisön ja yhteiskunnan kanssa. 

Joskus käy niin, että kaikista varotoimenpiteistä huolimatta tutkija 
jollain tavoin epäonnistuu kyselyasetelmansa kanssa. Tuloksia analysoi- 
taessa ja kirjatessa voidaan yrittää pelastaa se, mitä pelastettavissa on. 
Alkuperäiseen tutkimuskysymykseen ei ehkä saada vastausta, mutta ai- 
neisto voi antaa vastauksia johonkin muuhun. Etenkin opinnäytetöiden 
ollessa kyseessä voidaan miettiä luovasti, miten kandidaatti tai maisteri 
valmistuisi määräajassa. Suuren luokan katastrofien pitäisi lähtökohtai- 
sesti olla vältettävissä jo opinnäytetöistä alkaen. 


Tuloksia tulkitessa on aika tarkastella kriittisesti myös kysely- 
lomakettamme. Pohdimme, mikä merkitys on sillä, että annoim- 


me vastausvaihtoehdoiksi vain julkaistuihin kokonaismääritelmiin 
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sisältyneet komponentit, emme muita (saati kaikkia) mahdollisia 
komponentteja. Mietimme myös täytesanojen valinnan onnistu- 
mista. Huomaamme, että vaihtoehdoissa aakkosten alkupää (ah- 
distus) näyttää saavan enemmän rasteja kuin aakkosten loppupään 
vaihtoehdot. Vastaajat eivät ehkä ole jaksaneet käydä läpi kaikkia 
vaihtoehtoja. Toteamme, että tätä vääristymää voisi ehkä yrittää 
oikaista tilastotieteen keinoin, mutta välttämättä se ei onnistu. 
Löydämme edelleen hyvät perustelut kaikille lomakkeemme isoil- 
le ratkaisuille, mutta joitakin yksittäisiä sanavalintoja voisimme 
tehdä nyt toisin. Toteamme samalla, että tunnesanojen alkusana- 
kielisissä selityksissä riittää tutkittavaa myös jatkossa ja myös toi- 
sen tyyppisillä lomakkeilla. 


4. Yhteenveto 


Kuten lukija on ehkä huomannut, otteemme kyselymenetelmään on pai- 
koitellen melko normatiivinen. Toivomme tämän auttavan menetelmän 
omaksumisessa. Emme kuitenkaan ole halunneet karkottaa herkimpiä 
lukijoita ylenmääräisellä ankaruudella, vaan tahtomme on ollut ystäväl- 
lisesti ohjata tulevia tutkijoita pahimpien sudenkuoppien ohi. Kyselyn 
tekeminen on parhaimmillaan hulvattoman hauskaa, ja ensimmäisten 
tulosten ilmaantuminen tietokoneen ruudulle on jännittävämpää kuin 
lahjojen avaaminen jouluaattona! 

Kysely on kielentutkijalle erinomainen tutkimusmetodi, jolla on pal- 
jon etuja. Sen avulla voidaan kielestä tai kieleen liittyvistä käsityksistä 
saada sellaista uutta tietoa, jota muilla menetelmillä on hankalaa tai jopa 
mahdotonta saada. Kyselyllä voidaan kerätä laaja ja juuri kyseessä olevaa 
tutkimuskysymystä varten suunniteltu aineisto. Kyselyä voidaan suju- 
vasti yhdistellä myös muihin menetelmiin. 

Kyselyn käyttöön liittyviä riskejä pystytään huolellisella suunnit- 
telulla ennakoimaan. Tärkeintä on huomata, että näennäisestä yksin- 
kertaisuudestaan huolimatta kysely ei ole menetelmänä ihan helppo. 
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Onnistuneen kyselyn toteuttamiseen tarvitaan riittävästi aikaa ja viit- 
seliäisyyttä. Kyselyn menestyksekäs käyttö vaatii kielitieteellisen osaa- 
misen lisäksi vähintään jonkinasteista tietoa tilastotieteestä, ehkä 
myös psykologiasta. Tietoa on kuitenkin runsaasti ja helposti saatavilla 
menetelmäoppaissa. 

Ihannetapauksessa kyselyä harjoitetaan ryhmässä, jossa on moni- 
puolista osaamista ja jossa tehtäviä voidaan jakaa. Opinnäytetyötä te- 
kevän on — etenkin tukijoukkojen puuttuessa — suositeltavaa tukeutua 
aiemmin käytettyihin kyselyasetelmiin. Järkevä vaihtoehto voisi olla 
myös kerätä uusi aineisto opiskelijaryhmässä, jossa kukin analysoi osan 
tuloksista ja kirjoittaa opinnäytteensä osa-aineiston perusteella. Tai voi- 
siko graduryhmän joskus perustaa menetelmän eikä kielenilmiön tai 
oppiaineen ympärille? 

Kyselytutkimuksen teoria ja ideaalit ovat omat todellisuutensa, ja 
käytännössä on etsittävä tapa tehdä tutkimusasetelma järkevästi. On 
tehtävä kompromisseja ja luovuttava siitä hienoimmasta mahdollista lo- 
makkeesta, jota yksikään vastaaja ei jaksaisi täyttää asiallisesti loppuun. 
Sama pätee aineiston analyysissa. Parhaimmillaan kyselytutkimus tuot- 
taa kiinnostavaa ja luotettavaa tietoa suoraan vastaajilta tutkijalle. Tulok- 
set valottavat tutkijan ennalta keksimiä kysymyksiä ja tuovat tutkittavaan 
ilmiöön uusia, yllättäviäkin näkökulmia. 
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Mika? 


Sosiolingvistinen haastattelu tarkoittaa väljästi tulkittuna mitä tahansa 
keruutapaa, jossa tallennetaan puheaineistoa kasvokkaistilanteessa 
sosiolingvistisen tutkimuksen tarpeisiin. Tarkoituksena on yleensä saada 
analysoitavaksi informanteilta runsaasti ns. vapaamuotoista puhetta. Toi- 
sinaan käsitteellä viitataan vielä nykyäänkin William Labovin kehittämään 
keruuproseduuriin, jossa puhetta pyritään keräämään useasta eri kon- 
tekstuaalisesta tyylistä, toisinaan tästä edelleen kehiteltyyn keruutapaan 
tai esimerkiksi tapaan, jossa puheen annetaan virrata hyvin vapaasti. 
Katso myös: 

Luku 2 Kysely 

Luku 5 Lingvistinen etnografia toimintayhteisöissä 

Luku 9 Korpusaineistot 

Luku 13 Kielten dokumentointi ja kieliopin kuvaus 


Luku 21 Sosiolingvistiikka 
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1. Johdanto 


Sosiolingvistisessä variaationtutkimuksessa ja ylipäätään sosiolingvis- 
tiikassa käytetään useita aineistonkeruumenetelmiä, esimerkiksi haas- 
tatteluja, kirjallisia kyselyjä, kenttätutkimuksen yhteydessä tehtäviä 
kyselyjä, nopeita anonyymejä keruita ja osallistuvaa havainnointia (ks. 
esim. Milroy & Gordon 2003, 52-71; Sosiolingvistiikka, Lingvistinen 
etnografia toimintayhteisöissä, Kielten dokumentointi ja kieliopin ku- 


vaus tässä kirjassa). Se, mikä on hyvää aineistoa ja miten sitä pitäisi 
hankkia, riippuu täysin tutkimuksen tavoitteista ja tutkimuskysymyk- 


sistä (Milroy & Gordon 2003, 49). 

Edellä mainituista menetelmistä haastattelu on perinteinen tapa ke- 
rätä puheaineistoa sosiolingvistiikan lisäksi myös dialektologiassa. Sitä 
sovelletaan myös useilla muilla kielentutkimuksen aloilla ja yleisemmin- 
kin eri tieteenaloilla, erityisesti ihmistieteissä. Haastattelun on arveltu 
olevan jopa käytetyin tiedonhankkimisen menetelmä yhteiskuntaelämän 
eri alueilla (Tiittula & Ruusuvuori 2009, 9). 

Vaikka haastattelu menetelmänä ja nimityksenä on yleinen, ovat 
tutkijat käyttäneet metodinaan tarkemmin tarkasteltuna monenlaisia 
haastatteluja ja haastattelun merkitys on erilainen eri yhteyksissä. Haas- 
tattelujen eri lajeja on mahdollista tyypitellä ensinnäkin sen mukaan, 
kuinka tarkkaan ennen haastattelua on päätetty ja muotoiltu kysymykset 
ja mahdolliset vastausvaihtoehdot, mahdollisesti myös missä järjestyk- 
sessä kysymykset esitetään sekä kuinka sitovasti suunniteltuja ratkaisuja 
noudatetaan. Tämän perusteella haastattelut on tapana jakaa karkeasti 
strukturoituihin, puolistrukturoituihin ja strukturoimattomiin haastat- 
teluihin (Tiittula & Ruusuvuori 2009, 11)’. 

Nimensä mukaisesti strukturoitu haastattelu on näistä sidotuin haas- 
tattelulaji, jossa tiukimmillaan lomakemuotoisessa haastattelussa on 
tarkkaan muotoillut kysymykset ja vastausvaihtoehdot sekä kysymys- 
ten järjestys on vakioitu, jotta tutkija vaikuttaisi mahdollisimman vähän 
haastatellun vastauksiin. Strukturoitu haastattelu voidaan toteuttaa esi- 
merkiksi kokonaan suullisesti niin, että haastattelija esittää kysymyksen- 
sä suunnitellusti, haastateltava vastaa niihin ja haastattelu tallennetaan. 
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Vaihtoehtoisesti strukturoitu haastattelu voidaan toteuttaa niin, että 
haastattelija kysymysten esittämisen lisäksi myös kirjaa haastateltavan 
vastaukset. 

Strukturoimaton haastattelu puolestaan edustaa haastattelulajien jat- 
kumon toista ääripäätä, ja se muistuttaa eniten vapaamuotoista keskus- 
telua. Haastattelu ei etene niinkään kysymys-vastaus-parien mukaisesti, 
vaan sekä haastateltava että haastattelija voivat kuljettaa sitä toivomaansa 
suuntaan ja nostaa mieleensä tulevia asioita esiin. Tarkkojen kysymys- 
ten esittämisen sijasta pyritään keskustelunomaisuuteen ja luonnolli- 
suuteen, jotta haastatellulla olisi mahdollisuus kertoa kokemuksistaan, 
tuntemuksistaan, muistoistaan, mielipiteistään ja perusteluistaan (Hirs- 
järvi & Hurme 2000; Saaranen-Kauppinen & Puusniekka 2006). Sana- 
tarkasti strukturoimaton haastattelu ei ole kuitenkaan koskaan täysin 
strukturoimaton, koska haastattelulla on aina jokin tarkoitus tai päämää- 
rä ja usein esimerkiksi sen teema tai haastattelutilanne on etukäteen 
jotenkin sovittu tai määritelty. 

Puolistrukturoiduissa haastatteluissa, jotka asettuvat edellä esitettyjen 
ääripäiden väliin, on etukäteen päätetty ja lyöty lukkoon vain osa niis- 
tä kaikista tekijöistä, jotka on vakioitu strukturoidussa haastattelussa. 
Yksi yleisimmistä tämän haastattelulajin edustajista on teemahaastatte- 
lu, jossa haastattelua varten keskusteltaviksi suunnitellut aihepiirit ovat 
samoja kaikille haastateltaville (ks. Hirsjärvi & Hurme 2000, 47-48, 66; 
Saaranen-Kauppinen & Puusniekka 2006). 

Haastatteluja on tapana ja mahdollista luonnehtia myös sen mukaan, 
onko haastateltavia vain yksi, kaksi vai useita. Tämän perusteella käyte- 
tään sellaisia nimityksiä kuin yksilöhaastattelu, parihaastattelu ja ryhmä- 
haastattelu. Jako voi kertoa myös tarkemmasta haastattelun tekemisen 
tekniikasta: virikehaastattelussa mukana on esimerkiksi kuvamateriaa- 
lia, puhelinhaastattelussa vuorovaikutustilanne ei ole kasvokkainen, kä- 
velyhaastattelussa taas kuljetaan rinta rinnan samalla keskustellen (ks. 
esim. Törrönen 2017; Bamberg 2017; Ikonen 2017). Yhtä lailla haastat- 
teluja voidaan luokitella sen perusteella, millaiseen tietoon haastattelu 
kohdistuu. Esimerkiksi narratiivisissa eli kerronnallisissa haastatteluissa 
haastateltava kertoo kokemuksistaan; etnografinen haastattelu kohden- 
tuu haastateltavan elämänpiiriin. (Tiittula & Ruusuvuori 2009, 12.) 
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Kuten edellä esitetystä on käynyt jo ilmi, käytetään erilaisia haastat- 
teluja hyvin monella eri tieteen- ja tutkimusalalla. Tässä artikkelissa ei 
ole kuitenkaan mahdollista käsitellä menetelmää sen kaikessa kirjos- 
saan, ja keskitymmekin siksi seuraavassa siihen, miten sitä käytetään 
sosiolingvistiikassa.? Haastattelua on hyödynnetty dialektologiassa ja 
sosiolingvistiikassa ennen muuta, jotta tarkasteltavaksi on saatu kerät- 
tyä runsaasti puheyhteisön jäsenten puhetta. Esimerkiksi perinteisissä 
murrekeruissa kielentutkijaa eivät ole ensisijaisesti kiinnostaneet in- 
formanttien tiedot paikallisesta kansanperinteestä vaan se, kuinka he 
puhuvat. Tosin murteentutkimuksessakin informantin taustaa koskevat 
tiedot ovat olleet tärkeitä tutkijalle. Viimeistään sosiolingvistisen asenne- 
tutkimuksen ja erityisesti kansanlingvistisen tutkimuksen myötä haas- 
tatteluaineistossa on alkanut yhä enemmän kiinnostaa sen ohella, miten 
haastateltava puhuu, myös se, mitä hän puhuessaan kertoo. Sen sijaan 
esimerkiksi kasvatustieteilijöitä tai sosiologeja ei tyypillisesti kiinnos- 
ta haastatteluaineistossa se, miten haastateltavat kieltä käyttävät, vaan 
niiden asiasisältö. Tässä artikkelissa tarkastelemme haastattelua ennen 
muuta puhutun kielen tutkijoiden näkökulmasta. Laveammin ja katta- 
vammin haastattelua käsitellään muissa teoksissa, joista usea keskittyy 
tarkastelemaan yksinomaan haastattelua (ks. esim. Hirsjärvi & Hurme 
2000; Ruusuvuori & Tiittula 2009; Ruusuvuori, Nikander & Hyvärinen 
2010; Hyvärinen, Nikander & Ruusuvuori 2017). 


2. Haastattelumetodin historiaa 
2.1. Dialektologia ja haastattelu 


Puhutun kielen tutkimuksessa haastattelut ovat edustaneet aineiston- 
keruun valtavirtaa jo perinteisessä murteentutkimuksessa?, jota on har- 
joitettu tieteellisen kielentutkimuksen alkuajoista 1800-luvun lopulta 
(ks. esim. Juusela 1994, 1-2; Chambers & Trudgill 1998; Kurki & Mus- 
tanoja 2019). Kielitieteissä haastattelua on käytetty menetelmänä myös 
muun muassa sanasto- ja nimistökeruissa (ks. Nimistöntutkimus tk.) 
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Haastattelu kytkeytyi perinteisessä tutkimuksessa alkuaikoina yleensä 
haastatteluissa käytettyihin sanaluetteloihin ja kyselyihin, jotka usein 
olivat elisitoituja (ks. esim. Chambers & Trudgill 1998, 15-23; kyselyista 
yleisemmin ks. Kysely tk.; elisitoinnista Kielten dokumentointi ja kieli- 
opin kuvaus tk.). 

Myös Suomessa haastattelu on ollut murteentutkimuksessa väljästi 
määritellen yksi keskeisimmistä keruumenetelmistä 1800-luvun lopulta 


lähtien. Varhaisimmissa keruissa käytettiin keräilysanastoja, ja ensim- 
mäiset ohjeistetut keruumenetelmät koskivat nimenomaan näiden sana- 
luettelojen hyödyntämistä. Toisaalta Suomessa tehtiin huomioita myös 
yleisemmin haastateltavien puheesta, ja silloista täkäläistä menetelmää 
on luonnehdittu joskus kysele ja kuuntele -metodiksi. (Ks. Strandberg 
2004, 27-29.) 

Nauhurit yleistyivät murteentutkijoiden käytössä 1950-luvulla 
(Chambers & Trudgill 1998, 24-25), minkä myötä haastattelun merki- 
tys vahvistui entisestään. Jo tätä ennen oli murteen tallentamisessa käy- 
tetty jonkin verran muita laitteita 1900-luvun alkupuolella, mutta niitä 
tutkijan oli verrattain vaikeaa kuljettaa mukanaan keruumatkoillaan. 
Siksi murteen tallentaja joutui 1950-luvulle asti tukeutumaan haastatte- 
lussa tekemiinsä muistiinpanoihin. (Ks. esim. Yli-Paavola 1970, 9-11.) 
Nauhureiden yleistymisen myötä tavoitteeksi tuli tallentaa laajemmin 
mahdollisimman vapaamuotoista puhetta. Analyysissakaan ei oltu enää 
yksittäisen tutkijan ainutkertaisen kuulovaikutelman varassa (Chambers 
& Trudgill 1998, 24-25; nykyisistä tallennusvälineistä ja -tavoista ks. 
Kielten dokumentointi ja kieliopin kuvaus; Kokeellinen fonetiikka tk.). 


Yleisesti ottaen ero varhemmilla 1900-luvun alun välineillä tehtyihin 
verrattain harvinaisiin tallenteisiin oli huomattava, koska näitä ensim- 
mäisiä kielitieteellisiä näytteitä on luonnehdittu joskus etukäteen val- 
misteltujen esitysten kaltaisiksi, ”esitysnäytteiden luonteisiksi” (Yli-Paa- 
vola 1970, 2, 10-12, 43). 

Suomessa voi katsoa järjestelmällisen suomen murteiden äänitystyön 
aloitetun viimeistään vuonna 1959, jolloin perustettiin SKNA eli Suo- 
men kielen nauhoitearkisto (ks. tietolaatikko 1). Vaikka muun muassa 
Suomessa huomio oli kohdistunut jo ennen nauhureita toki muihinkin 
kuin yksittäisiin sanoihin", tarjosivat nauhoitteet tutkijoille uudenlaista 
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monipuolista aineistoa muun muassa lause- ja tyyliopin tarkasteluun ja 
keinoja myös puheen painotuksen, intonaation, puherytmin, äänteiden 
keston ja laadun kokeellisfoneettiseen tutkimukseen. Osaltaan ne sisäl- 
sivät luonnollisissa käyttöyhteyksissään runsaasti myös muoto-opillista, 
sanastollista ja fraseologista aineistoa (Yli-Paavola 1970, 10-12). 


2.2. Klassinen sosiolingvistinen haastattelu 


Sosiolingvistinen haastattelu muistuttaa monin tavoin edellä esitettyä 
murteentutkimuksessa käytettyä haastattelua. Niissä maissa, joissa 
murreaineistoa kerättiin lähinnä kyselyin ja sanaluetteloin tai kysymällä 
keruuretkillä suoraan tietoja yksittäisistä sanoista tai rakenteista, siirtymä 
vanhoista menetelmistä vapaamuotoisen puheen tarkastelemiseen haas- 
tattelun keinoin oli huomattava (ks. Kielten dokumentointi ja kieliopin 


kuvaus tk.). Sen sijaan esimerkiksi puhesuomen tutkimuksessa siirtymä 
sosiolingvistiseen haastatteluun oli vähäisempi (ks. esim. Mielikäinen 
1982, 278—279), koska fennistit olivat tehneet murrehaastatteluja hyvin 
yleisesti jo ennen kuin sosiolingvistiset vaikutteet alkoivat näkyä Suo- 
messa 1970-luvun taitteessa. Täälläkin tutkimus uudistui, mutta mur- 
teentutkimuksen ja uuden sosiolingvistisen variaationtutkimuksen välil- 
le ei kehkeytynyt syvää juopaa (Suojanen 1982, 9; Nuolijärvi 1990, 120). 

Sosiolingvistinen haastattelu on nimityksenä monimerkityksinen, 
koska sillä tarkoitetaan toisinaan mitä tahansa sosiolingvististä tutki- 
musta varten kasvokkaistilanteessa tallennettua puheaineistoa.5 Joskus 
käsitteellä viitataan sellaiseen haastatteluproseduuriin, jollaisen William 
Labov (1972a; 1972b) kehitti ja joka omaksuttiin sosiolingvistiikkaan. 
Näiden lisäksi sosiolingvistinen haastattelu voi tarkoittaa jotakin edel- 
lä mainitun Labovin klassisen sosiolingvistisen haastattelun pohjalta 
muokattua tai sovellettua haastattelutapaa, esimerkiksi sellaista, jossa 
keskustelun annetaan virrata hyvin vapaamuotoisesti. (Ks. esim. Feagin 
2013, 29; Becker 2013.) 

Labovin (19723; 1984) klassinen sosiolingvistinen haastattelu kytkey- 
tyy hänen käsitykseensä tyylillisestä vaihtelusta ja siihen havaintoon, 
että puhujien tietoinen huomio omaan kielenkäyttöönsä vaihtelee eri 
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tilanteissa. Labovin New Yorkin puhekieltä tarkastelevasta tutkimuksesta 
lähtien sosiolingvistinen haastattelu klassisessa mielessä onkin muo- 
dostunut hyvin usein viidestä kontekstuaalisesta tyylistä. Haastattelu- 
proseduurin aikana haastateltavalta on ollut tarkoitus saada aineistoksi 
valikoima informantin koko tilanteisen variaation jatkumosta, vapaa- 
muotoisimmasta muodollisimpaan puhetapaan. (Ks. esim. Meyerhoff 
2011, 34; Meyerhoff, Adachi, Nanbakhsh & Strycharz Meyerhoff 2012, 
130; Becker 2013, 91-92; Meyerhoff, Schleef & MacKenzie 2015, 46-51.) 

Klassinen sosiolingvistinen haastattelu muodostuu ensinnäkin 
varsinaisesta haastattelusta eli keskustelunomaisesta osiosta (engl. 
conversational speech), jossa haastattelija ja haastateltava(t) keskustele- 
vat. Fdellä esiteltyä terminologiaa käyttäen tässä osiossa on kyse teema- 
haastattelusta. Keskustelunomaisessa osiossa puhutaan etukäteen 
ainakin väljästi määritellyistä aihepiireistä, ja samassa yhteydessä on 
tavallisesti kartoitettu myös puhujan taustatietoja (esim. ikä, koulutus, 
ammatti), jotka ovat olleet tarpeellisia, kun on analysoitu sosiaalisten 
taustamuuttujien ja kielenkäytön yhteyttä. 

Itse haastatteluosion lisäksi klassisessa sosiolingvistisessa haastatte- 
lussa on kolme strukturoitua elisitoitua osiota, joissa informantti joutuu 
kiinnittämään kieleen ja omaan puheeseensa erityistä huomiota (elisi- 
toinneista ks. Kielten dokumentointi ja kieliopin kuvaus tk.). Ensinnä- 


kin haastateltavalle on annettu luettavaksi teksti, jokin tarinanomainen 
katkelma (engl. reading passage). Oletuksena tässä osiossa on, että infor- 
mantin kielenkäyttö on jonkin verran huolitellumpaa kuin itse haastatte- 
lussa. Tämän lisäksi informantille on annettu kaksi erillistä tehtävää, joi- 
den oletetaan olevan epätavallisia arkiselle kielenkäytölle: sanaluetteloja 
(engl. word lists) läpikäydessä huomion oletetaan kiinnittyvän muotoon 
eikä niinkään merkitykseen, ja minimipareissa haastateltava tarkastelee 
yksittäisten sanojen välisiä pienimpiä eroja (engl. minimal pairs). 
Kertyvästä puheaineksesta (ks. asetelma 1) varsinaisen haastattelun 
kielen ajatellaan muistuttavan eniten epämuodollisinta puhetapaa eli 
sitä, jota käytetään perheenjäsenten tai vertaisten kanssa. Tämä puhe- 
aineisto on jaettavissa Labovin mukaan (19723; 2001) vielä tarkem- 
min muun muassa topiikin ja keskustelukumppanin vaihdosten pe- 
rusteella tavalliseen arkipuheeseen (engl. casual style) ja huoliteltuun 
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arkipuheeseen (engl. careful style). (Ks. esim. Meyerhoff, Adachi, 
Nanbakhsh & Strycharz Meyerhoff 2012, 130; Meyerhoff, Schleef & 
MacKenzie 2015, 49-50.) 


tavallinen huoliteltu luku- sanalistat minimiparit 
arkipuhe arkipuhe puhunta 


Asetelma 1. Klassisen sosiolingvistisen haastattelun viisi kontekstuaalista tyyliä 
epämuodollisimmasta muodollisimpaan. 


Klassinen sosiolingvistisen haastattelun perusasetelma kytkeytyy tilan- 
teiseen vaihteluun ja siihen havaintoon, että puhujien tietoinen huo- 
mio omaan kielenkäyttöönsä vaihtelee eri tilanteissa. Sen sijaan, että 
tutkija rakentaisi tilanteisen vaihtelun tarkastelemiseksi edellä esitellyn 
viisikohtaisen tutkimusasetelman strukturoituineen tehtävineen, on 
luonnollisesti täysin mahdollista pyrkiä tarkastelemaan kvalitatiivises- 
ti samaista ilmiötä toisin kerätyistä vapaamuotoisista keskustelutilan- 
teista (Meyerhoff, Schleef & MacKenzie 2015, 50). Itse asiassa Labovin 
käsitys edellä esitellyistä kontekstuaalisista tyyleistä on saanut osakseen 
runsaasti kritiikkiä: muun muassa tavallisen ja huolitellun arkipuheen 
erottelua toisistaan haastatteluaineistosta on pidetty ongelmallisena ja 
on huomautettu, että tietyissä yhteyksissä, joissa puhuja on hyvinkin 
tietoinen kielenkäytöstään, saatetaan puhua korostetun murteellisesti 
(kritiikistä ks. esim. Meyerhoff 2011, 44-49; Becker 2013, 93-94). 


3. Haastatteluin kerätyt aineistot 


Niin kuin edeltä on jo käynyt ilmi, haastattelu ei käsitteenä rajaa kovin 
tarkoin viittauskohdettaan, vaan haastatteluksi voidaan kutsua varsin 
erilaisia vuorovaikutustilanteita (ks. myös esim. 1-6). Kuka tahansa voi 
päätyä haastattelumaiseen keskustelutilanteeseen esimerkiksi työpaik- 
kaa hakiessaan, lääkärin vastaanotolla tai vaikka poliisikuulustelussa. 
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Lehtijutut perustuvat usein journalistisiin haastatteluihin, ja lähes joka 
ilta voi televisiosta seurata erilaisia uutis- ja viihdehaastatteluja. Kaltai- 
sessamme haastatteluyhteiskunnassa (ks. Silverman 1993, 248) haastat- 
telu on paitsi suosittu myös useimmille meistä varsin tuttu ja arkinen- 
kin puhetilanne. 

Rajanveto jonkin sellaisen puhetilanteen, jota ei enää ole mielekäs- 
tä pitää ensisijaisesti haastatteluna, haastattelumaisen keskustelun ja 
haastattelun välillä voi olla vaikeaa. Sen sijaan niin sanotun prototyyp- 
pisen haastattelun tunnusmerkit ovat selvät. Prototyyppisessä kahden- 
keskisessä haastattelussa osallistujilla on ensinnäkin hieman toisistaan 
poikkeavat roolit, kun toinen ensisijaisesti kysyy ja kuuntelee ja toinen 
vastaa ja kertoo (ks. esim. 1-2; Mustanoja 2011, 82-83). Haastattelijan 
tehtävää hoitaa haastattelunteon ammattilainen, esimerkiksi tutkija tai 
toimittaja, kun taas haastateltava on valikoitunut rooliinsa, koska hänellä 
on hallussaan jotakin haastattelijaa kiinnostavaa: tietoa, taitoa, mieli- 
piteitä — tai vaikka kieltä. 


Esim. 1:* 
Haastattelija: missä päin sä oot muutem matkustellu? 
Informantti: (no), Ranskassa Saksassa, Itävallassa, Espanjassa 
Enlannissa, Tanskassa Ruätsissa Norjassa. [haastattelija: joo-o] ja 
oor) käyny, Venäjäm pu(a)lella käytii. tais se oli sillon Ne"vvosto- 
liitto (ni). 

Esim. 2: 
Haastattelija: no niin no koulunkäynti sitte, noil luettelomaisesti. 
Informantti: no, kansakoulu ja, sittet Tampereen, tyttölyseo, joka 


oli sillon yhdeksäv vuoti(e), -vuotinej ja, sitte, farmasian, laitos, 
Helsinnissä Helsinnin yliopisto? farmasiallaitos. 
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Sosiolingvistiikassa haastateltavaa on usein kutsuttu informantiksi, 
vanhemmassa murteentutkimuksessa kielenoppaaksi tai arvokkaasti 
kielimestariksi (esim. Suojanen 1982, 9; ks. myös Johdannon luku 4 


tk.). Prototyyppisessä haastattelussa on läsnä aina myös ylimääräinen” 
osapuoli, mukana oleva tallennusväline. Joskus tämä tallennusväline 
on lehtiö ja kynä, joskus kamera ja nauhuri, ja toisinaan läsnä on ko- 
konainen kuvausryhmä. Tallennuslaitteisiin hallintavalta on ensisijai- 
sesti haastattelijalla, mikä sekin kuuluu prototyyppisen haastattelun 
roolitukseen. 

Haastattelulla tuotettavaa kokemuksellista tietoa on totuttu — toisi- 
naan jopa kritiikittömästi — pitämään jotenkin erityisen aitona ja luotet- 
tavana. Tämä on vahvistanut haastattelujen asemaa tieteellisten aineis- 
tojen keruussa. Haastattelujen suosioon on niin ikään vaikuttanut se, 
että haastattelu saattaa tuntua yksinkertaiselta aineistonkeruun mene- 
telmältä. Hyvä tutkimushaastattelu ei kuitenkaan toteudu samanlaisella 
suoralla tekniikalla kuin toimittajan tai poliisin tekemä haastattelu. On- 
nistunut vuorovaikutus on paljon muuta kuin mekaanista kysymysten 
esittämistä. (Hyvärinen 2017, 11-12.) Haastattelun tekemisen tekniik- 
kaan palaamme tarkemmin luvussa 4. 

Haastattelusta tekee erinomaisen aineistonkeruun menetelmän kui- 
tenkin se, että haastattelun avulla voidaan saada tietoa asioista, jotka 
ovat tapahtuneet aikaisemmin jossain toisaalla — tilanteessa, jossa tutki- 
ja ei ole itse voinut olla läsnä. Kielentutkimuksellisten tarkoitusperien, 
esimerkiksi variationistisen piirreanalyysin, näkökulmasta haastattelu 
myös näyttäytyy suhteellisen vapaamuotoisena puhetilanteena, jossa 
informantin ääntä on todennäköistä saada talteen lähes maksimaali- 
sesti mihin tahansa muuhun vuorovaikutustilanteeseen verrattuna. On 
kyllä mahdollista, että esimerkiksi asiointitilanne tai ystäväjoukon peli- 
ilta tuottaa yhdeltä henkilöltä saman verran materiaalia tuntia kohden 
kuin haastattelu. Tutkijan vaikutusmahdollisuudet saatavan aineiston 
määrään ovat kuitenkin näissä tilanteissa huomattavasti vähäisemmät 
ja yleiset epävarmuustekijät suuremmat. 
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3.1. Tavoitteena luonnollinen, vapaamuotoinen puhe 


Sosiolingvistisissä keruissa tavoitteena on tyypillisesti saada ”autenttis- 
ta” tai ”luonnollista” puhetta, jolla tarkoitetaan väljästi tulkittuna jotain 
sellaista puhetapaa, jota suositaan läheisten tai ystävien kanssa, kun ti- 
lannetta ei koeta muodolliseksi (Labov 1972a, 208; Labov 1972b, 128). 
Tällaista puhetta nimitetään vernakulaariksi (engl. vernacular; Labov 
1972b, 112; Meyerhoff, Schleef & MacKenzie 2015, 46—47). Tavoitetta 
on kuitenkin vaikeaa tai suorastaan mahdotonta täysin saavuttaa, sillä 
sosiolingvisti joutuu kohtaamaan aina havainnoijan paradoksin (engl. 
observer's paradox; Labov 1972b, 113, 209): Tutkijat ovat kiinnostuneita 
siitä, kuinka ihmiset puhuvat spontaanisti arkielämässään eli kuinka 
he puhuvat silloin, kun heidän kielenkäyttöään ei tarkkailla. Paradoksi 
syntyy, koska informantin puhetta halutaan nimenomaan tarkastella ja 
tallentaa. Tallennettaessa a) kerääjä tai tutkija on hyvin usein läsnä, b) 
tallennusväline — nauhuri tai kamera — on väkisinkin aina paikalla ja c) 
itse tallennustilanne herättää tavalla tai toisella informantin huomion 
(Meyerhoff, Adachi, Nanbakhsh & Strycharz 2012, 132). 
Vernakulaarikin on käsitteenä monimerkityksinen. Yhteistä eri mää- 
ritelmille on kuitenkin, että niissä vernakulaari nähdään jonkinlaisena 
ääripäänä tai vastakohtana kyseessä olevan kielen standardivarieteetille?. 
(Ks. esim. Milroy & Gordon 2003, 49-50; Meyerhoff 2011, 361.) Oma 
lukunsa on se, että tutkijat ovat kyseenalaistaneet, onko olemassa tai 
määriteltävissä jokin tietty luonnonmukaisin puhetapa (vernakulaari), 
johon tutkijat pääsisivät käsiksi, kun puhuja ei kiinnitä puheeseensa 
mitään huomiota. Puhujat mukauttavat kielenkäyttöään aina jotenkin, 
ja puhetapaan vaikuttavat muutkin seikat (esim. kommunikaation ta- 
voitteet, sanoman sisältö ja osallistujat) kuin se, kuinka tietoisesti pu- 
huja kiinnittää kielenkäyttöönsä huomiota. Vernakulaarin tarkastelua 
pidetään mielekkäänä, mutta sen yksioikoista yhdistämistä ”tavalliseen 
puheeseen” ja normittamattomien kielimuotojen ominaispiirteisiin pi- 
detään ongelmallisena. (Ks. esim. Milroy & Gordon 2003, 49-51; Becker 
2013, 95; Schilling 2013, 60-61, 104.) Milroy ja Gordon pitävät selvänä, 
että variaationtutkijoiden tutkimuskohteena vernakulaari on käsitteenä 
abstraktio siinä kuin luonnollinen kielikin. Käsitteenä se on tarpeellinen 
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ja käyttökelpoinen, kunhan tiedostaa ja muistaa sen abstraktiuden. Ta- 
voitteena on yleensä tarkastella luonnollista kieltä sen vapaamuotoisissa 
käyttöyhteyksissä, mutta koska kielenkäyttö on aina tiukasti sidoksissa 
käyttökontekstiin, on varottava esittämästä, että jossakin tietyssä tilan- 
teessa informantin puhe olisi luonnollisempaa tai ”tilanteettomampaa” 
kuin muissa yhteyksissä. (Milroy & Gordon 2003, 50.) 


3.2. Kritiikki ja rajoitukset 


Haastatteluista on perustellusti esitetty, että ne eivät ole puhekielen 
tutkimuksessa ongelmaton tapa kerätä vapaamuotoista informanttien 
kieltä. Haastattelua pidetään arkielämälle epätavallisena genrenä, minkä 
vuoksi sen ei voi varauksettomasti katsoa soveltuvan täysin vapaamuo- 
toisen puheen tallentamiseen. Toisaalta muun muassa Penelope Eckert 
(2000) on huomauttanut, että kielenpuhujat ovat kielellisesti sopeutu- 
via ja mukautuvia niin tutkimuksellisissa kuin ei-tutkimuksellisissakin 
kielenkäyttöyhteyksissä, minkä vuoksi he pystyvät mukauttamaan kiel- 
tään luonnollisesti (sosiolingvistiseen) haastatteluunkin sopivaksi aivan 
kuin kaikkiin muihin tilanteisiin, joihin he arjessaan päätyvät. 

Kenties osuvin haastattelua koskeva kritiikki kohdistuu siihen, että 
vaikka haastattelu soveltuu erityisesti tutkimuksiin, joissa tarkastel- 
laan taajaan puheessa esiintyviä fonologisia, morfologisia ja osin myös 
syntaktisia piirteitä, ovat kuitenkin useat piirteet niissä epätavallisia (esi- 
merkiksi informantin esittämät kysymykset tai informantin käyttämä 
yksikön toinen persoona). Haastatteluille ominaisen rakenteen takia ne 
eivät sovellu esimerkiksi aineistoksi keskusteluntutkimukseen, jossa 
kiinnostuksen kohteena yleensä on vuorovaikutuksen rakentuminen 
keskustelussa (ks. esim. Milroy 1987, 24-26, 62-69; Feagin 2013, 26- 
27, Lappalainen 2004, 15-16). Esimerkiksi monille viime vuosisadal- 
la tallennetuille suomalaisille murrehaastatteluille on ominaista, että 
äänessä niissä on enimmäkseen haastateltava. Silloisissa keruuohjeis- 
sa on usein erikseen mainittu, että koska tavoitteena on ollut tallen- 
taa vanhakantaista murretta ja siten saada äänitettyä informantin pu- 
hetta, ei haastattelijan pidä keskeyttää puhujaa eikä lyhyiden taukojen 
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jälkeen pidä ryhtyä heti esittämään uusia kysymyksiä (Yli-Paavola 1970, 
53). Tärkeä on huomata, että tavoitteena on ollut saada talteen toisaal- 
ta ”runsassisältöistä” ja "vanhakantaista" mutta toisaalta ”luonnollisen 
vapaata puhetta” (ks. Yli-Paavola 1970, 47). Näitä kahta osatavoitet- 
ta voi pitää osin ristiriitaisina, jos pitkän monologimaisen kerronnan 
odottaa kattavan kaiken mahdollisen kielenkäytön luonnollisen vapaan 
puheen kirjosta. Ohjeistusta ja kerättyä aineistoa voi pitää kuitenkin 
tarkoituksenmukaisena, koska kyseistä aineistoa ei ole alun perin ke- 
rätty vuorovaikutuslingvististen aiheiden tutkimista varten. Kaiken 
kaikkiaan ei ole mitään sellaista keruutapaa, joka tarjoaisi soveltuvaa 
aineistoa kaikille tutkimuskysymyksille. 

Todettava on sekin, että osa murteentutkimuksessa käytettyjen haas- 
tattelujen kritiikistä tuntuu osin kumpuavan siitä mielikuvasta, jonka 
haastattelu nimityksenä synnyttää (Kurki 2005, 65): esimerkiksi Lesley 
Milroy havainnollistaa perusteltua kritiikkiään esittämällä, että tiukalle 
haastattelulle on ominaista luokkahuonetilannetta muistuttava kysy- 
mys-vastaus-rakenne (Milroy 1987, 24-26, 62-69). Sama luonnehdinta 
ei ole kuitenkaan osuva, jos se kohdistetaan fennistisiin murrehaastatte- 
luihin ja erityisesti sosiolingvistisiin haastatteluihin, silla kuvatunlainen 
haastattelutapa on täkäläisissä äänitteissä epätavallinen. Tämä ilmenee 
kuuntelemalla äänitteitä ja tutustumalla kerääjille tehtyihin ohjeistuk- 
siin. Sama käy ilmi myös katkelmista, jotka ovat Tampereen puhekielen 
haastatteluista (ks. esim. 3-6; Mustanoja 2011, 81-83, 116). 


Esim. 3 (arkipäiväinen, keskustelunomainen): 


Informantti: -- ja stek kum mää oon semmone että mää lihon kau- 
hee herkästin ni em mää viitti [laittaa ruokaa], mitä mä ny ostav vii- 
lia ja, mää söi” noita kanan koipia yhteen aikaam mää ostin) kuule 
että, [haastattelija: jaa.] mul oli joka päivä kuulen niitä ja, ku” mää 
aatteli että ne ei lihota ja ne em mää stä rasvaa siittä syäny. mä ittel 
laiton kato(k) kyä sää tiät ne koivet [joo.] sillai, pistin" uuniij ja, 
mää en on neljääv viikkoonn ostanu ainootaka koipee. kylä niis- 
säkik kuulev vaan (--), ja kum mää en tiä (mutta) niistä mää kyllä 
varmaal lihoi. oom mää ny viis kiloo, laihtu(nu). (ku en os syäny), 
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mää on ollu" Nutritelle. Nutri-, mitä ne Nutri-, 
Haastattelija: (--) laihdutus-, -valmisteita. 

Informantti: nii joo, Nutriletti. 

Haastattelija: jaa, no onkos, millasta se sitte oikeen o? 


Informantti: no em mää tiäk ku, (em mä) oikeen tahro, viis kiloo 
on kylä mennym mutta, mutta siin o aikaakii kylä kulunu. 


Haastattelija: miten sitä niinku otetaan sitä, Nutrilettia (nys sitten)? 
Informantti: ne on sem(mose)sa, mää nyn näytän sulle. 
Haastattelija: näytä. 
Informantti: ai älä kun (ni kann)istuu (---). [haastattelija voivottelee, 
informantti siirtyy kauemmas mikrofonista ja kolistelee taustalla] 
voi (tuolta tullee) kauhee sade, [haastattelija: jaa.] (äkkiä--) tulee. 
nää on kuulet tämmösiä pusseja. tää vaa, kylmääv veteen tää vanili- 
lam makune ja sitte, stek kun or) keittoo nin kuumaav vetteen (--). 
[haastattelija: jaaha, joo, joo.] tästä tulee ninkuk kaks (desilitraa). 
Esim. 4 (roolien kääntyminen): 


Haastattelija: no käytkös sä usein tyttären tykönä siä Helsinnissä? 


Informantti: juu kyllä m(ä) o, käynyn nytkin, esmes tä(n) vuodem 
puolela jo kaks kertaa. 


Haastattelija: tulee sitten nähtyä vähän eri kaupunkeja tässä 
kuitenki. 
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Informantti: no joo kyllä, kyllä. joo. tässä, nyt' on ollu yhteisiä näi- 
tä, tän, näitä hankkeita ni("), niidenki" takia olen ollu. 


Haastattelija: että yhteistyötä oikein. 


Informantti: no joo, ei meillä ny(), oikeestaan sen kummempaa o 
ollum mut tä- tässä nytt o(-), ihan, (sat)tu, sattu näin asioista. 


[24 sekunnin hiljainen hetki] 


Informantti: sulla ov Viialassa sten koti, m- mi-, että sää, pääset 
sinne, joka viikovvaihde? -vaihde ilmeisesti. 


Haastattelija: no aika usein kyllä. 

Informantti: tunnetko (--), Viialan, ih- ihmiset yleensäk kaikki? 
Haastattelija: no aika paljoj joo. 

Informantti: tunsitko Virtasen Erkkiä? 


Esim. 5 (informantti kertoo tietyt tärkeät asiat riippumatta siitä, mitä 


on kysytty): 


Informantti: heräs piäni, piäni tetalje, em malta ollak kertomat- 
ta niistä, minull oli stem, vähä, minä olin, olin todella ykstoista- 
vuatias, taikka täytin sitte heinäkuussa ykstoist(a), (ee) ja sitten oli 
pikkusev vanhempia, kolmetoista ja viistoista vuatiaita ja, ja sillom 
me olimme siälä, Suomem pankin talon, kellareissa ja pitkin aina 
kuv varsinkin kun, Tampereev valtaus läheni, mutta, mutta tuata, 
ne sitten ne kolmetoista ja viistoista vuatiaat ne oli jo ser) kokosia 
ettei ne oikeen ninkun, arvannu, lähtee ennää, kaupunkille, urk- 
kiin ja, varsinkin tämä viistoistavuatias veljeni, nii nii, oli kovin, 
sitten aktiivinen jo, ninkun nyt saattoi ollakkij ja, hän sitten aina 
usutti että ”meen nyj ja kuuntelet tarkkaam mitä ne puhuu ja 
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kuuntelen nys siälä ja ja kuuluuko Vilppular rintamalta mitääj ja 
mistä kuuluu ja” -- 


Esim. 6 (vitsailu): 
Haastattelija: käyk sää, saunavuorolla? 


Informantti: no mull ei os saunavuäroo sillai kum mää kay! lenkki- 
saunassa sitte. 


Haastattelija: minkäslainen se sitten on? 


Informantti: no se on semmone että kun kiá(t)tàà talonn ympäri 
juäksee nii s'ttev voi mennäl lenkkisaunaa. [naurua] 


Viime vuosisadan murrenauhoitteetkin ovat tavallisesti strukturoitujen 
haastattelujen sijasta väljästi strukturoituja tai tiukimmillaan puolistruk- 
turoituja teemahaastatteluja. Vaikka kerääjille tehdyissä ohjeistuksissa 
mainitaan, että aihepiiri niissä voi olla täysin rajoittamaton, esiintyvät 
niissä tyypillisesti väljinä aihepiireinä haastateltavan omat elämänvai- 
heet ja kokemukset sekä erityisesti 1950-, 1960- ja 1970-lukujen tal- 
lenteissa kansanperinteen, kansatieteen, kansanrunouden tai paikallis- 
historian aiheet (Yli-Paavola 1970, 48). Useasti ohjeissa sivutaan sitä, 
ettei haastatteluja pidä toteuttaa kaavamaisesti, ja kerääjiä on opastettu 
erikseen olemaan pikemminkin tarkkaavaisia kuuntelijoita kuin kuu- 
lustelijoita ja välttämään vastausten tiukkaamista. Heitä on kehotettu 
sallimaan puheenaiheesta poikkeamiset ja tarpeen mukaan johdatte- 
lemaan informantit hienovaraisesti aiheeseen. Erikseen ohjeistuksessa 
mainitaan, että toisinaan haastattelun ollessa vapaimmillaan voi tutkija 
jättäytyä haastateltavan vietäväksi ja antaa informantin valita puheen- 
aiheet. (Ks. esim. Yli-Paavola 1970, 43-45, 47.) Viimeksi mainitut ohjeet 
ovat sellaisia, että sellaisenaan toteutuessaan haastattelutilanne olisi en- 
nemminkin strukturoimaton kuin strukturoitu. 

Ylipäätään on kuitenkin huomattava, että pelkästään suomalaisessa 
murteentutkimuksessa on tehty yhteensä kymmeniä tuhansia tunteja 
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murreäänitteitä, ja niiden joukkoon mahtuu hyvin monenlaisia haastat- 
teluja. Haastattelu on ollut Suomessa yleisnimitys usean vuosikymme- 
nen ajan murrenauhoituksille, ja siksi pelkän nimityksen perusteella ei 
voi tehdä kovin pitkälle meneviä päätelmiä esimerkiksi niiden keskuste- 
lun rakenteesta, luontevuudesta tai vapaamuotoisuudesta. Kaikki suoma- 
laisten äänitearkistojen haastatteluiksi luokitellut kielitieteelliset äänitteet 
(esim. SKNA, ks. tietolaatikko 1; ks. Korpusaineistot tk.) eivät ole välttä- 


mättä edes haastatteluja, vaikka ne onkin arkistoitu sillä nimellä. 


3.3. Metodin jatkokehitys 


Varsinkin 1980-luvun lopulta lähtien, jolloin puhutun kielen tutkimuk- 
sen näkökulmat ovat laventuneet entisestään (esimerkiksi keskuste- 
luntutkimus), on haastattelumetodin rajoituksista keskusteltu kansain- 
välisessä ja suomalaisessa tutkimuskirjallisuudessa. Se, että haastattelun 
rajoituksista ja mahdollisista ongelmakohdista on keskusteltu, on joh- 
tanut siihen, että on kehitetty myös erilaisia keinoja lieventää tai ohittaa 
niitä (ks. esim. Milroy & Gordon 2003, 65—68). Näillä keinoilla pyritään 
karkeasti joko a) vaikuttamaan haastattelun sisältöön ja siihen, millaista 
kieltä haastattelussa esiintyy, tai b) vaikuttamaan kasvokkaishaastattelun 
dynamiikkaan, siis haastattelijan ja haastateltavan tai haastateltavien vä- 
liseen suhteeseen. 

Eräs tällainen keino, jolla on pyritty vaikuttamaan ensin mainittuun, 
on ollut käytössä jo Labovin New Yorkin englantia koskevasta tutki- 
muksesta lähtien: siinä pyritään ohjaamaan puhe tapahtumaan, jossa 
haastateltava oli joutunut hengenvaaraan (ks. Labov 1972a, 93). Aja- 
tuksena tässä oli, että tunnekuohussa ihminen ei tavallisesti kiinnitä 
huomiota niinkään kielenkäyttöönsä vaan asian sisältöön. Kysymällä 
hengenvaarasta tutkija pyrkii saamaan haastateltavan muistelemaan itse 
koettua kuohuttanutta tapahtumaa ja siten siirtämään mahdollisimman 
paljon puhujan ajatukset pois siitä, kuinka hän asiansa esittää. Keino 
vaikutti onnistuneelta Labovin tutkimuksessa niin kuin monissa muis- 
sakin, mutta vastaavasti useasta muusta tutkimuksesta on vastakkai- 
sia esimerkkejä. Fri tutkijat ovat pyytäneet muistelemaan ja kertomaan 
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kummitusjuttuja, muistelemaan jotain merkittävää tapahtumaa lapsuu- 
dessa tai teini-ikäisiä kertomaan oman koulun eri koululaisryhmien vä- 
lisistä eroista ja jännitteistä. (Milroy & Gordon 2003, 66; Feagin 2013, 
29-30.) Haastattelu ja sen toteutus pitää aina sopeuttaa ja mukauttaa 
tarkasteltavana olevaan yhteisöön (Feagin 2013, 30). Tärkeää on yrit- 
tää miettiä ja löytää aiheita, joista haastateltavat puhuvat mielellään ja 
vapautuneesti. 

Haastattelijan ja haastateltavan väliseen dynamiikkaan on pyritty 
vaikuttamaan esimerkiksi tekemällä yksilönauhoitusten sijasta pari- tai 
ryhmänauhoituksia. Samoin on tehty nauhoituksia, joissa tutkija ei ole 
ollut läsnä. Näissäkin nauhoitustavoissa on vahvuutensa ja heikkouten- 
sa. Ensin mainituissa aineisto voi olla äänenlaadultaan heikkoa varsin- 
kin, jos kaikilla informanteilla ei ole omia mikrofonejaan, ja sitä voi olla 
määrällisesti ja tyylillisesti hyvin epätasaisesti. Jälkimmäisissä on omat 
ongelmansa, jos keskusteltavia teemoja ja asetelmaa ei ole mietitty. Pa- 
himmillaan tallennetut keskustelut eivät ole mitenkään keskenään ver- 
tailukelpoisia ja aineiston määrä (äänitteiden kesto, tutkittavien tapaus- 
ten määrä) voi vaihdella liiaksi. Erikseen on huomattava, että vaikka 
tutkija ei olekaan paikalla, voivat nauhoitettavat olla korostetun tietoisia 
nauhoittamisesta ja puhetavastaan, mikä vaikuttaa siihen, millaista ai- 
neistoa tulee tallennetuksi. (Eri kokeiluista ja niiden hyvistä ja huonoista 
puolista ks. esim. Milroy & Gordon 2003, 66-67; Schilling 2013, 111-113; 
ks. Kielten dokumentointi ja kieliopin kuvaus; Lingvistinen etnografia 


toimintayhteisöissä tk.) 


4. Haastattelun tekemisen tekniikkaa 

4.1. Yleistä 

Vaikka haastatteluksi voidaan kutsua varsin monenlaisia aineiston- 
keruutapahtumia, on haastattelujen tekemiseen mahdollista antaa joi- 
takin yleispäteviä vinkkejä. Kokemuksen myötä kullekin sitten muodos- 


tuu oma hyväksi havaittu tyylinsä ja toimintamallinsa. Onnistuneen ja 
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lingvistiseen tutkimukseen soveltuvan haastatteluaineiston voi kerätä 
monella tavalla, mutta jos jotakin olennaista — vaikkapa videokameran 
lataaminen — unohtuu, tilanne saattaa olla menetetty eikä uusintahaas- 
tattelun mahdollisuutta välttämättä järjesty. Tämä koskee kaikkea ling- 
vististä aineistonkeruuta, sillä puhetapahtumat ovat ainutkertaisia eikä 
niitä voi toistaa samalla tavalla kuin esimerkiksi kemiallista koetta. 

Jotta lopputulos olisi mahdollisimman onnistunut, haastattelu kan- 
nattaa ajatella kolmivaiheiseksi prosessiksi, joka koostuu 1) edeltävistä 
toimenpiteistä, 2) varsinaisesta haastattelutilanteesta ja 3) haastattelun 
jälkeisistä toimenpiteistä. Vaikka itse haastattelutilanne usein ajatuksen 
tasolla korostuu jo pelkästään jännittävyytensä vuoksi, on syytä muistaa, 
että jokainen näistä kolmesta vaiheesta on oikeastaan yhtä tärkeä. 


4.2. Ennen haastattelua 


Ensimmäisessä, haastattelua edeltävässä vaiheessa huomio on kiinnitet- 
tävä informanttien valintaan ja heidän kanssaan viestimiseen, tallennus- 
välineisiin ja niiden käytön harjoitteluun sekä omaan valmistautumi- 
seen. Informanttien valinta perustuu suoraan tutkimuskysymyksiin eli 
siihen, kenen kielenkäyttöä tai näkemyksiä tutkimuksessa selvitetään. 
Jos tutkimuksen kohteena on tunnetun tamperelaisen jääkiekkoilijan 
tremulanttiääntämys, pyritään tätä nimenomaista jääkiekkoilijaa haas- 
tattelemaan. Tällaista tutkimusta voidaan luonnehtia myös tapaus- 
tutkimukseksi. Jos taas tutkimuskohteena on yleisesti tamperelaisten 
tremulanttiääntämys, haastatteluun valitaan tutkimuksen laajuuden ja 
käytettävissä olevien resurssien rajoissa mahdollisimman edustava jouk- 
ko esimerkiksi eri-ikäisiä, eri sukupuolia ja erilaisia koulutustaustoja 
edustavia syntyperäisiä tamperelaisia. Tässä tapauksessa tutkimuksen 
kohteina eli havaintoyksikköinä ovat kaikki tamperelaiset henkilöt, jot- 
ka yhdessä muodostavat tutkimuksen perusjoukon. Varmin tapa saada 
kattava käsitys tamperelaisten tremulanttiääntämyksestä olisi haastatella 
kaikki perusjoukkoon kuuluvat. Koska tällainen suurtutkimus on käy- 
tännön syistä oletettavasti mahdoton, on tutkijan muodostettava otos. 
Karkeasti tarkastellen informantit voidaan valita joko satunnaisotannalla 
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(engl. random sample) tai harkinnanvaraisella otannalla (engl. judgment 

sample) (otantatavoista sosiolingvistiikassa ks. esim. Schilling 2013, 31- 

36; Meyerhoff, Schleef & MacKenzie 2015, 37—39; ks. myös Kysely tk.). 
Edustavaksi otokseksi voidaan kutsua sellaista tutkittavien henkilöiden 


joukkoa, joka kuvastaa tarkasti perusjoukon ominaisuuksia, esimerkiksi 
ikä-, sukupuoli- ja sosioekonomista jakaumaa. Edustava otos perustuu 
usein satunnaisuuteen eli haastateltavien arvontaan perusjoukosta. Aina 
satunnaisotanta ei kuitenkaan ole mahdollinen, välttämätön tai miele- 
käskään tapa hankkia henkilöitä haastateltaviksi. Esimerkiksi 1970-lu- 
vun Nykysuomalaisen puhekielen murros -hankkeen aineistonkeruussa 
haastatellut on kyllä valittu väestörekisterin luetteloista, mutta varsinais- 
ta satunnaisotantaa ei raportoida käytetyn. Käytännössä haastateltavat 
on kuitenkin valittu umpimähkäisesti ja nimet on poimittu siinä järjes- 
tyksessä kuin tutkimuksen vaatimukset täyttävä henkilö on luetteloissa 
esiintynyt (ks. esim. Jonninen-Niilekselà 1982, 14). 

Voi myös olla, että perusjoukkoon kuuluvista havaintoyksiköistä ei 
edes ole olemassa tarkkaa tietoa. Esimerkkinä tällaisesta tilanteesta 
voidaan mainita erilaisten sosiolektien, vaikkapa homososiolektin (ks. 
esim. Surkka 2016, 5; Lindeman 2017, 31-34), tutkimus. Tällöin miele- 
käs tapa on etsiä esimerkiksi tuttavien avustuksella muutamia kohde- 
ryhmään kuuluvia henkilöitä ja pyytää heiltä haastattelun yhteydessä 
vinkkejä toisista tutkimukseen soveltuvista henkilöistä. Näin pikkuhiljaa 
muodostuu harkinnanvarainen näyte perusjoukosta. Dialektologiassa 
ja sosiolingvistiikassa tällaisesta aineistonhankinnan menetelmästä on 
käytetty osuvasti nimitystä lumipallotekniikka. Satunnaisotannalla muo- 
dostetun edustavan otoksen ja lumipallotekniikalla muodostetun näyt- 
teen väliin jää lisäksi lukuisia muita tapoja, joilla päteviä ja tutkimuksel- 
lisesti antoisia uusia haastatteluaineistoja voidaan hankkia. Nykypäivänä 
internet mahdollistaa uudella tavalla erilaisten yhteisöjen tavoittamisen 
— joskin muistettava on, että informanttien etsiminen internetin välityk- 
sellä rajaa sekin osan henkilöistä tutkimuksen ulottumattomiin. 

Riippumatta siitä, millä tavoin haastateltavat tutkimukseen etsi- 
tään, olennaiseksi muodostuu aineistonkeruun läpinäkyvyys aina 
ensivaiheista lähtien. Kun tutkimuksen myöhemmälle lukijalle on sel- 
vää, millä tavoin aineisto on koostettu, myös tulosten tulkinta asettuu 


LUKU 3 HAASTATTELU AINEISTONKERUUN METODINA SOSIOLINGVISTIIKASSA 293 


mittakaavaansa. Informanttien valintaperiaatteiden ja aineistonkeruun 
vaiheiden merkityksen ymmärtäminen on kuitenkin tärkeintä tutkijalle 
itselleen: siinä missä aineistonkeruun menetelmät ovat suorassa yhtey- 
dessä tutkimuskysymyksiin,? tulosten tulkinta on riippuvaista tutkimus- 
menetelmistä — aineistonkeruun menetelmät mukaan lukien. 

Toinen edustavuuteen liittyvä kysymys on, kuinka paljon informant- 
teja tutkimuksessa on oltava, jotta aineisto olisi edustava. Usein ensim- 
mäinen ohje tähän on se, että mitä enemmän aineistoa on, sitä parem- 
pi. Käytännöllisistä syistä on usein kuitenkin järkevää miettiä, mikä on 
riittävän suuri aineisto, sen sijaan, että keräisi turhan suuren aineiston, 
jota ei pysty kuitenkaan hallitsemaan ja analysoimaan. Kaikkiaan vas- 
taus riippuu ennen muuta siitä, mitä tutkitaan ja mikä on tutkimuksen 
tavoite. (Ks. esim. Feagin 2013, 28-29; Hoffman 2014, 30-31.) Jos vertaa 
sitä, mitä pidetään määrällisesti edustavana otoksena esimerkiksi luon- 
nontieteissä ja mitä kielitieteessä, on ero huomattava. Usein on esitetty, 
että kielitieteessä määrällisesti edustavan aineiston ei tarvitse olla niin 
suuri kuin luonnontieteissä (ks. tark. Milroy & Gordon 2003, 28-29 ja 
siinä mainitut lähteet). 

Huomioon on otettava otoksen ja perusjoukon suhde ja valittava otos 
tarkasti niin, että se on perustellusti edustava. Jos tarkasteltaviksi halu- 
taan ottaa esimerkiksi kielenulkoisia tekijöitä, kuten ikä, sukupuoli ja 
koulutus, kussakin ryhmässä on oltava riittävästi informantteja, jotta 
aineisto olisi edustava. On aivan eri asia, halutaanko tarkastella nyky- 
nilsiäläisten ammattikoululaisten ja lukiolaisten kielestä jotakin, ovatko 
tarkasteltavina vielä laajemmin pohjoissavolaiset ammattikoululaiset 
ja lukiolaiset vai peräti kaikki nykysuomalaiset ammattikoululaiset ja 
lukiolaiset. Nyrkkisääntönä esitetään usein, että viiden informantin ryh- 
mä on riittävän edustava variationistisessa sosiolingvistiikassa (Feagin 
2013, 28-29; Hoffman 2014, 30-31). Edellistä esimerkkiä soveltaen 
tarvitsisimme siis viisi nilsiäläistä ammattikoululaista ja viisi lukiolais- 
ta. Jos tarkastelussa on tarkoitus ottaa huomioon muitakin sosiaalisia 
tekijöitä, tarvitaan aineistoa enemmän. Toisin sanoen, jos haluamme 
tarkastella koulutuksen lisäksi myös sukupuolen vaikutusta kielenkäyt- 
töön, tarvitsemme kaikkiaan 20 informanttia: ammattikoulusta viisi 
nilsiäläistyttöä ja -poikaa sekä vastaavasti lukiosta viisi tyttöä ja poikaa. 


294 TOMMI KURKI JA LIISA MUSTANOJA 


(Ks. esim. Milroy & Gordon 2003, 28-30; Feagin 2013, 28-29; Hoffman 
2014, 30-31.) Sali Tagliamonte (2006, 31) esittää jopa, että kun tarkas- 
teltavana on useita kielenulkoisia tekijöitä, riittäisi kuhunkin ryhmään 
kaksikin informanttia (siis esimerkiksi ammattikoulusta kaksi nilsiä- 
läistyttöä ja -poikaa sekä kaksi lukiolaistyttöä ja -poikaa). Näin pienissä 
pareista muodostuvissa ryhmissä alkavat yksilölliset erot vaikuttaa jo 
vahvasti ryhmien ”yleisedustuksiin”. Muutenkin on tärkeää, että ryh- 
mien muodostamisessa pyritään valikoimaan informantit niin, että he 
kuuluvat aidosti samaan yhteisöön ja sosiaaliseen verkostoon. 

Haastateltavien valinta on vasta ensimmäinen askel kohti haastattelu- 
jen toteutusta. Seuraava askel on selvittää, suostuvatko sopiviksi katsotut 
haastateltavat haastatteluun, ja jos suostuvat, sopia haastattelusta heidän 
kanssaan. Yhteydenoton mahdollisuuksia on monia: Potentiaalisia haas- 
tateltavia voi lähestyä esimerkiksi kirjeitse, puhelimitse, tekstiviestitse, 
sähköpostitse tai hyödyntämällä sosiaalisen median teemoittain määrit- 
tyneitä keskusteluryhmiä tai muita ryhmiä. Joskus yhteydenotto onnis- 
tuu tuttavan tai sukulaisen avustuksella, joskus ensimmäinen kontakti 
on luontevimmin opettaja, työnantaja tai jonkin seuran tai yhdistyksen 
toimihenkilö. Olennaista on arvioida, millä tavoin yhteydenotto juuri 
tähän haastateltavaan tai haastateltavien joukkoon on sopivinta ja tuottaa 
todennäköisimmin toivotun lopputuloksen eli sen, että sopivaksi katsot- 
tu henkilö suostuu haastatteluun. 

Potentiaalisten haastateltavien joukossa on aina sellaisia ihmisiä, jot- 
ka oikeanlaisen yhteydenoton seurauksena suostuvat haastateltaviksi 
mutta vääränlaisen yhteydenoton seurauksena kieltäytyvät. Kokemuk- 
semme mukaan tällainen oikeanlainen yhteydenotto perustuu ennen 
muuta siihen, että henkilö saa heti ensikontaktin aikana asiallista ja 
riittävää tietoa tutkimuksesta. Olennaista on muistaa myös kertoa po- 
tentiaaliselle haastateltavalle, miten tärkeää haastateltavien löytyminen 
on tutkimuksen onnistumisen kannalta ja miksi juuri kyseinen henkilö 
soveltuisi hyvin tutkimukseen. Monille informanteille on myös tärkeää 
kuulla se, että haastattelutilanteessa ei ole oikeita tai vääriä vastauksia 
(jos tosiaan näin ei ole) vaan että kaikki vastaukset ovat yhtä arvokkaita. 

Sitä, että tutkimuksessa tarkastellaan nimenomaan informantin 
puhekieltä tai sen tiettyä osa-aluetta, ei kuitenkaan ole syytä korostaa 
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yhteydenoton aikana. On havaittu, että mitä tietoisempi informantti on 
siitä, että hänen kieltään tarkataan, sitä tarkemmin hän kiinnittää nau- 
hoitustilanteessa huomiota kielenkäyttöönsä ja sitä standardinomaisem- 
paa (tai mahdollisesti liioitellun murteellista) hänen kielenkäyttönsä on. 
Tämä ei kuitenkaan tarkoita, että henkilölle valehdeltaisiin tai että hänel- 
tä kaikin keinoin pimitettäisiin tutkimuksen tarkoitus. Sekä tutkimus- 
eettisesti että tutkimuksen onnistumisen kannalta mielekäs ratkaisu 
on kertoa tutkimuksesta esimerkiksi niin, että mainitsee yliopiston tai 
hankkeen, jonka piirissä tutkimusta tehdään. Tämän lisäksi tutkimusta 
voi luonnehtia yleisesti lingvistiseksi tai kielitieteelliseksi tai kuvata sen 
luonnetta yleistajuisemmin esimerkiksi niin, että tutkimuksessa kerä- 
tään aineistoa eri puolilla Suomea asuvilta ihmisiltä tai että tutkimukses- 
sa tarkastellaan haastatteluita, joissa ihmiset kertovat aiheesta X ja Y. Jo 
tässä ensivaiheessa on myös hyvä jollakin tavalla luonnehtia haastattelun 
luonnetta (vapaamuotoinen vai strukturoitu) ja ennen muuta sen kestoa: 
sitä, onko kyse kymmenestä minuutista vai tunnista. 

Tutkimuskysymysten ja niihin vastaamisen kannalta on olennaista 
miettiä paitsi haastateltavien määrää myös sitä, kuinka paljon yhdeltä 
haastateltavalta halutaan aineistoa. Aivan tarkkaan tätä ei voi koskaan 
suunnitella, sillä esimerkiksi tunnin mittainen haastattelu voi tarkoit- 
taa tapauskohtaisesti hyvin erilaista määrää varsinaista haastattelu- 
puhetta. Variaationtutkimuksessa tavallinen havainto on, että jotakin 
kielenpiirrettä voi toisella informantilla esiintyä runsaasti, kun taas 
toisella informantilla saman piirteen esiintymät ovat harvinaisia. Osit- 
tain ilmiössä on kyse siitä, että eri haastattelut ajautuvat erilaisille urille 
käsiteltävien aihepiirien mukaan. Jos esimerkiksi hämäläistaustaisen 
puhujan haastattelussa päädytään puhumaan kaupunkeista ja erityi- 
sesti Helsinkistä ja siellä asumiseen liittyvistä onkelmista, nk-yhtymän 
potentiaalisia vaihtelutapauksia saattaa esiintyä haastattelussa parikin- 
kymmentä. Jos taas haastattelu kääntyy muihin aiheisiin, piirteen esiin- 
tymät jäävät yhden käden sormin laskettaviksi. (Ks. esim. Mustanoja 
2011, 219—220, 225—226.) Jotkin variaatioilmiöt, esimerkiksi inessiivin 
päätteet tai diftongien avartuminen, taas ovat siinä määrin frekventte- 
jä ja sanatasosta riippumattomia, että niiden osumisesta haastattelu- 
puheeseen ei tarvitse ennalta murehtia. 
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Osittain yhden haastattelun avulla tarkasteluun saatavien piirteiden 
määrään vaikuttaa yksinkertaisesti osallistujien puhenopeus ja mietintä- 
taukojen määrä ja kesto. Nämä taas palautuvat yksilöiden temperament- 
tiin ja omaksuttuihin vuorovaikutuskäytänteisiin. Vaikutuksensa on 
myös tilanteen tulkinnalla, esimerkiksi sillä, kuinka muodolliseksi tai 
epämuodollisen jutustelevaksi haastattelu koetaan. Kovin muodollisessa 
tilanteessa haastateltavan vastaukset voivat jäädä lyhyiksi ja toteaviksi, 
mutta myös hyvin epämuodollinen jutustelu, jossa haastattelija ottaa 
tilaa ja käyttää pitkiä puheenvuoroja, saattaa saada aikaan sen, että haas- 
tateltavan puhetta saadaan toivottua vähemmän. Sen sijaan oletettujen 
heimostereotypioiden ja saadun tutkimusmateriaalin määrän suhteesta 
ei ole raportoitua tutkimustietoa; ”vilkkaiden karjalaisten” ja ”hitaiden 
hämäläisten” joukkoon mahtuu temperamenttipiirteitä laidasta laitaan 
niin, että yksilövariaatio ylittää ryhmärajat monin verroin (ks. myös 
Yli-Paavola 1970, 56). 

Haastattelijan kannalta haastattelun keston suunnittelu liittyy ylei- 
seen ajankäytön organisointiin ja esimerkiksi sen miettimiseen, kuinka 
monta haastattelua yhteen päivään mahtuu. Jos haastattelu on suunni- 
teltu esimerkiksi tunnin kestoiseksi, on haastattelijan hyvä varata sille 
käytännössä kaksi tuntia aikaa siirtymisiin käytettävän ajan lisäksi. Ai- 
kaa nimittäin kuluu: parkkipaikan löytämiseen, laitteiden virittelyyn, 
esitietolomakkeen ja tutkimuslupien täyttämiseen, suunniteltua pidem- 
mäksi venyneeseen haastatteluun, laitteiden purkuun, kohteliaasti juo- 
tuun kahvikupilliseen — vain joitakin mainitaksemme. 

Etukäteen pitää valmistautua myös tutustumalla tallennusvälineisiin 
ja harjoitella niiden käyttöä. Koska haastateltavien on tarkoitus kiinnittää 
mahdollisimman vähän huomiota tallennusvälineisiin ja haastattelu- 
tilanteeseen, pitää välttää kaikin tavoin sitä, että laitteiden toiminnan 
tarkistamiseen ja hapuiluun menisi aikaa. Haastattelut äänitetään ny- 
kyisin tavallisesti digitaalisin nauhurein tai videoidaan videokameran 
tai kannettavan tietokoneen avulla. Videokuvaamisen etuna on, että 
tällöin tallennetuiksi tulevat äänen lisäksi muun muassa ilmeet, eleet 
ja esimerkiksi, kehen katse kohdistuu tai mihin suuntaan puhuja konk- 
reettisesti viittoo viitatessaan johonkuhun läsnäolevaan. Video helpot- 
taa myös litterointivaihetta varsinkin niissä tilanteissa, joissa esiintyy 
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päällekkäispuhuntaa ja halutaan varmistua, kuka mitäkin sanoo. Siksi 
on tärkeää, että kamera (tai tietokone) sijoitetaan niin, että kaikki tallen- 
nettavat henkilöt näkyvät selvästi kuvassa ja että kuvanlaatu on riittävän 
hyvä. Kuvausteknisesti hyväksi havaittu tapa on sijoittaa haastattelijan ja 
haastateltavan tuolit mahdollisuuksien mukaan noin 90 asteen kulmaan 
toisiinsa nähden. Tällöin kamera on mahdollista sijoittaa esimerkiksi 
pöydälle niin, että molemmat osapuolet mahtuvat kuvaan, jolloin myös 
molempien ilmeet ja eleet näkyvät paremmin verrattuna esimerkiksi sii- 
hen, että haastattelun osapuolet istuutuisivat pöydän vastakkaisille puo- 
lille ja tilanne taltioitaisiin suoraan sivulta päin — tai vielä hankalammin 
niin, että haastateltavan kasvot kyllä näkyisivät, mutta haastattelijasta 
tallentuisi vain takaraivo. 

Etukäteen on tutustuttava siihen, millaiselta alueelta mikrofoni tal- 
lentaa ääntä ja miten mikrofoni on syytä sijoittaa puhujiin nähden. Osa 
mikrofoneista tallentaa ääntä ensisijaisesti tietystä suunnasta, osa tietyis- 
tä suunnista ja osa tasaisemmin joka puolelta laitetta. Onpa kyse mistä 
tahansa tallennusvälineestä, on ennen haastatteluun lähtöä varmistutta- 
va, että laitteessa on varmasti koko tilannetta varten riittävästi virtaa: jos 
laite ei toimi verkkovirralla, on tarkistettava akku (tai paristot). Akku- tai 
paristokäyttöinen laite voi tallentaa ääntä vielä silloinkin, kun virtaa on 
vähän jäljellä, mutta pahimmillaan se vaikuttaa äänenlaatuun niin, että 
toistonopeus on epätasainen. 

Tallennetaanpa haastattelusta pelkkä ääni tai sekä ääni että kuva, on 
ehdottoman tärkeää, että äänenlaatu on muutenkin riittävän hyvä. On 
huomattava, että nykyään monenlaisilla puhelimilla pystyy tallentamaan 
ääntä, mutta vaikka korvin kuunnellen niiden äänenlaatu vaikuttaakin 
hyvältä, eivät ne useinkaan sovellu kielitieteellisten tallenteiden teke- 
miseen. Erityisen tärkeää on huomata, että jos tarkoitus on hyödyntää 
tallennettua aineistoa myös foneettisissa kokeellisissa mittauksissa, on 
digitaalisella äänitteellä minimivaatimukset. Tavallisesti tallenteet, jot- 
ka ovat 16-bittisiä ja joiden näytteenottotaajuus on 44,1 kHz, vastaavat 
laadultaan tutkimuksen vaatimuksia. Tämän vuoksi äänitettä ei pidä 
tallentaa millään sellaisella digitaalisella tallentimella, joka tallentaa 
äänitiedoston johonkin pakattuun formaattiin (esim. mp3): tällöin tal- 
lennuksen pakkausvaiheessa osa äänen mikrodatasta häviää, ja sitä ei 
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pysty enää mitenkään palauttamaan. Lähtökohtaisesti suositeltavaa on, 
että ääni tallennetaan esimerkiksi wav-muodossa. (ks. Kokeellinen fo- 
netiikka tk.) 

Vielä erikseen on korostettava henkisen valmistautumisen ja harjoitte- 
lun merkitystä. Jos haastattelua varten on olemassa kysymysrunko, kan- 
nattaa haastattelijan tutustua kysymyksiin huolellisesti ennen kentälle 
lähtöä. Ennalta tutustuminen helpottaa esimerkiksi jatko- tai täydentä- 
vien kysymysten keksimistä tilanteessa, jossa keskustelu uhkaa tyreh- 
tyä ja aikaa olisi vielä jäljellä. Kun haastattelija tuntee haastattelurungon 


ja suunnitellut teemat hyvin, hän voi jo ennalta järjestellä kysymykset 
itselleen luontevalla tavalla. Huippu-urheilijat harrastavat mielikuva- 
harjoittelua, ja sama menetelmä sopisi haastattelijoillekin. Kun etukäteen 
miettii, miten tosipaikan koittaessa puhuu rauhallisesti, keskittyy kuu- 
lemaansa aidosti ja selvittää rennosti hankalat hetket, näin myös toden- 
näköisemmin tapahtuu. Haastattelussa voi tapahtua mitä tahansa: puhe- 
limet soivat, yskänkohtaus yllättää ja keskustelu ajautuu sellaisille urille, 
että informantti liikuttuu tai kimmastuu. Vaikeaksikin muodostuneen 
tilanteen saa kääntymään paremmaksi etukäteen mietityillä strategioilla. 
Pienille suunnistajille opetetaan ennen metsään lähtöä PJR-tekniikka: jos 
paniikki meinaa yllättää, pysähdy ja rauhoitu. Sama pätee haastattelu- 
tilanteessa. Esimerkiksi hiljaiset hetket voivat tuntua pitkiltä silloin, kun 
itse haastattelijan roolissa ei keksikään sanottavaa. Jälkikäteen kuunnel- 
tuina tauot eivät kuitenkaan kuulosta lainkaan niin pahoilta. 

Erittäin suositeltavaa on toteuttaa jonkinlainen harjoitushaastattelu 
ennen varsinaisten informanttien lähestymistä. Tämän voi toteuttaa 
vaikka opiskelijakaverin tai perheenjäsenen kanssa. Harjoitus ei tie- 
tenkään täysin simuloi autenttista tilannetta, mutta sen perusteella saa 
hyvän käsityksen haastattelurungon toimivuudesta ja siitä, miltä esimer- 
kiksi tunnin mittainen haastattelu tuntuu. Samassa yhteydessä pääsee 
myös testaamaan tallennusvälineitä. 

Jo ennen haastattelujen aloittamista on tärkeää huomioida tutkimuk- 
sen etiikkaan ja tietosuojaan liittyvät kysymykset. Erityisesti tietosuojaan 
liittyvät käytännön ohjeet hakevat vielä tämän artikkelin kirjoitushetkellä 
muotoaan, eikä esimerkiksi eri yliopistojen kesken ole vielä sovittu yhte- 
nevistä käytänteistä. Muun muassa siitä, kuka opiskelijoiden tekemissä 


LUKU 3 HAASTATTELU AINEISTONKERUUN METODINA SOSIOLINGVISTIIKASSA 299 


tutkimuksissa toimii rekisterinpitäjänä, on erilaisia tulkintoja. Tämän 
vuoksi on hyvä keskustella käytänteistä oman työn ohjaajan kanssa tai 
tarvittaessa konsultoida esimerkiksi yliopiston lakimiestä. Näin tarvit- 
tavat toimet (esim. tietosuojailmoitus, haastateltavan suostumus ja riit- 
tävä informointi tutkimuksen tarkoituksesta) tulevat hoidetuiksi asian- 
mukaisesti ja ongelmilta vältytään. Pitkään murteentutkimuksessa ja 
sosiolingvistiikassa katsottiin riittäväksi, että tutkija kysyy suullisen lu- 
van informantin puheen tallentamiseen, mutta nykyään normaali käy- 
täntö on, että informanteilta pyydetään kirjallinen suostumus. Alaikäi- 
sen haastateltavan ollessa kyseessä lupa pyydetään hänen huoltajaltaan. 
Useilla eri yliopistojen laitoksilla tai arkistoilla on valmiita suostumus- 
tai sopimuspohjia, joita voi hyödyntää. Asiallinen toiminta aineiston- 
keruun alkumetreiltä lähtien turvaa myös aineistojen jatkokäytön. 

Haastatteluaineiston käyttöä ohjaavat tutkimuseettiset periaatteet 
ja pyrkimys toimia hyvän tieteellisen käytännön mukaisesti (ks. esim. 
TENK; Aineistonhallinnan käsikirja; ks. myös Ranta & Kuula-Luumi 
2017). Aineistoa ei muun muassa saa käyttää mitenkään informanttien 
vahingoksi, ja sitä tulee hyödyntää niin, ettei esimerkiksi informantteja 
koskevia arkaluontoisia asioita tule ilmi tutkimuksista. Koska eri infor- 
mantit on usein välttämätöntä pystyä erottamaan toisistaan mutta usein 
informanttien henkilöllisyyttä ei haluta paljastaa tai se pitää ehdottomas- 
ti salata, voidaan heille luoda pseudonyymit: esimerkiksi saman perheen 
tai ikäryhmän informanteille voidaan antaa samalla kirjaimella alkavat 
keksityt nimet tai informanteille voidaan luoda kirjaimista ja numeroista 
muodostuvat tunnistekoodit, jotka kertovat heidän taustastaan jotakin 
olennaista. Erikseen on hyvä muistaa vielä se, että tutkimusta ei voisi yli- 
päätään toteuttaa ilman vapaaehtoisten informanttien myötämielisyyttä, 
joten mahdollisuuksien mukaan on hyvä miettiä, miten tutkija pystyy 
vastavuoroisesti osoittamaan kiitollisuuttaan informanteille (ks. esim. 
Rickford 1997; Wolfram, Reaser & Vaughn 2008) ja yhteisölle vaikkapa 
kertomalla yhteisöä koskevan tutkimuksensa tuloksista. 
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4.3. Haastattelun aikana 


Se, kuinka haastattelussa edetään ja minkä verran haastattelijan on tar- 
koitus ohjailla keskustelun kulkua, riippuu tutkimuksen tavoitteista ja 
siten myös siitä, onko kyse strukturoidusta, puolistrukturoidusta vai 
strukturoimattomasta haastattelusta. Kuten edellä ilmeni, on strukturoi- 
duissa haastatteluissa yleensä tarkat aiheet ja kysymykset, minkä lisäksi 
kysymysten järjestys voi olla hyvin tarkasti sidottu. Teemahaastatteluis- 
sakin, joissa on usein löyhästi määritellyt aiheet, hyödynnetään erilaisia 
aihemoduuleja: aihepiirejä ja niihin liittyviä kysymyksiä on suunniteltu 
etukäteen. Jos tutkijan huomio kohdistuu keskustelun sisältöjen sijasta 
itse kielenkäyttöön, on näiden tarkoitus auttaa keskustelun etenemi- 
sessä. Keskustelun annetaan virrata vapaasti, mutta niitä hetkiä varten, 
jolloin keskustelu tuntuu tyrehtyvän, hyödynnetään samaan aihepiiriin 
liittyviä kysymyksiä. Etukäteen on usein mietitty myös eri vaihtoehtoi- 
sia tapoja siirtyä aihepiireistä toisiin, jotta keskustelu tuntuisi etenevän 
luontevasti asiasta toiseen. Aihemoduuleja hyödynsi jo Labov varhaisis- 
sa tutkimuksissaan (ks. tark. esim. Labov 1984), ja niitä on hyödynnetty 
myös Suomessa useissa tutkimushankkeissa ja tutkimuksissa osana 
haastattelurunkoa. Olennaista on, että puolistrukturoiduissa haastatte- 
luissa aihemoduuleja ei ryhdytä käyttämään tiukkana kysymyslistana, 
jota seurataan jäykästi ja orjallisesti. 

Jos haastattelun tarkoitus on selvittää informantin tietoja, käsityk- 
siä tai mielikuvia määrätyistä aihepiireistä ja kysymyksistä, on aihe- 
moduuleja suunniteltaessa mietittävä, mitkä kysymyksistä ja aiheista 
ovat sellaisia, joista ainakin halutaan saada tietoa. Haastateltavat — olivat- 
pa he kuinka kiinnostuneita aiheesta ja tutkimuksesta tahansa — jaksavat 
vain määrällisen ajan keskittyä haastatteluun. Myös joidenkin kysymys- 
ten järjestystä voi olla tarpeen miettiä ennalta. Tyypillisesti esimerkik- 
si haastateltavien omaa kielenkäyttöä koskevat näkemykset on jätetty 
haastattelun loppuun, sillä aihepiirin esiin nostaminen saattaa vaikuttaa 
haastateltavan kielenkäyttöön. 

Ennen muuta tärkeää on pyrkiä tekemään tallennettavasta tilanteesta 
mahdollisimman luonteva ja epämuodollinen. Tähän voi vaikuttaa aina- 
kin valmistautumalla itse hyvin haastatteluun: tavoiteltavaa ei ole tehdä 
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haastattelussa suurta numeroa itse tilanteesta vaan pyrkiä olemaan ai- 
dosti kiinnostunut siitä, mitä toisella on kerrottavaa, ja pyrkiä reagoi- 
maan hänen puheenvuoroihinsa. Erikseen on huomattava myös, että 
silläkin on merkitystä, kuinka aineistoa keräävä käyttäytyy ja kommuni- 
koi informanttinsa kanssa ennen varsinaista haastattelua ja sen jälkeen. 
Mahdollinen oma jännittyneisyys tai oman kielenkäytön rekisterin muu- 
tokset vaikuttavat herkästi myös informanttiin. Haastattelun tekemiseen 
sisältyy usein, että informantin kanssa jutustellaan ennen tallennetta- 
vaa osiota ja sen jälkeen: jos kiirehtii töykeästi heti paikalta, kunhan on 
mielestään saanut riittävästi aineistoa, kiirii tutkijan huono maine pian 
hänen edelleen ja seuraavien informanttien löytäminen vaikeutuu. Sa- 
malla tämä voi vaikeuttaa myös toisten tutkijoiden toimintaedellytyksiä. 

Koska dialektologi, sosiolingvisti tai variaationtutkija on kiinnostunut 
ennen muuta informanttiensa kielenkäytöstä, useissa ohjeistuksissa ke- 
hotetaan antamaan tilaa informanteille ja välttämään tilanteita, joissa 
kerääjä on runsaasti äänessä (esim. Feagin 2013, 31). Tutkijan liiallinen 
äänessä oleminen ilmenee viimeistään siinä vaiheessa, kun aineistoa 
litteroidaan ja havaitaan, että informantilta aineistoa on vain niukas- 
ti. Toisaalta, jotta tallennettava tilanne olisi mahdollisimman luonteva 
ja rento, on suositeltavaa, että kerääjä osoittaa informantille, että hän 
kuuntelee aktiivisesti ja on kiinnostunut siitä, mistä keskustellaan. 
Jotta tilanne olisi mahdollisimman keskustelunomainen, on hyvä aja- 
tella haastattelutilannetta myös vastavuoroisuuden kannalta (ks. esim. 
Nordberg 1982, 108-109; Kurki 2005, 66; Feagin 2013, 31): jos oletam- 
me, että informantit suostuvat äänitettäviksi ja kertovat usein myös 
henkilökohtaisista asioistaan, on odotuksenmukaista, että myös kerääjä 
osallistuu keskusteluun ja jakaa vastavuoroisesti kokemuksiaan ja ker- 
too mielipiteitään. On siis pyrittävä tasapainoilemaan kahden ääripään 
välillä: toisaalta vältettävä ajautumista kyselijän ja passiivisen kuunteli- 
jan rooliin, toisaalta huolehdittava, ettei hallitse keskustelua omilla pit- 
killä puheenvuoroillaan ja vie tilaa informantilta. 
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4.4. Haastattelun jalkeen 


Onpa haastattelu tallennettu video- tai audiolaitteistolla, on tallennettu 
haastattelu syytä siirtää talteen toiselle laitteelle ja tehdä siitä varmuus- 
kopio. Varmuuskopioita ei pidä säilyttää samalla laitteella tai, jos kyse on 
analogisesta tallenteesta, samassa tilassa alkuperäiskappaleen kanssa. 
Eri yliopistoilla ja tutkimuslaitoksilla on erilaisia käytäntöjä ja palveluja 
aineistojen säilyttämiseen. Näihin on syytä tutustua jo etukäteen, jotta 
kerätty aineisto on mahdollista välittömästi siirtää asianmukaiseen ja 
myös tietoturvan näkökulmasta luotettavaan paikkaan. Tärkeää on var- 
mistaa, että siirron jälkeen ylimääräisiä kopioita ei jää äänityslaitteille 
tai muistitikuille ajelehtimaan. Aineistojen asianmukainen säilytys on 
haastattelijan velvollisuus ja haastateltavan oikeus. 

Mahdollisimman pian haastattelun jälkeen kannattaa kirjata muistiin 
haastattelusta perustiedot (aika, paikka, osallistujat, nauhoitteen kesto), 
joita tarvitaan ainakin, jos tallenne arkistoidaan. Hyvä on myös kirjata 
muistiin huomioita, vaikutelmia ja tunnelmia, joita keruuhetkellä syn- 
tyi. Tällaisia voivat olla esimerkiksi arvio haastattelun yleistunnelmasta 
(jännittynyt vai rento) ja raportti nauhoitustilanteen aikana sattuneista 
keskeytyksistä mutta yhtä lailla sekin, jos informantilla on kurkku kipeä- 
nä tai suussa juuri saadut hammasraudat artikulaatiota hankaloittamas- 
sa. Jos näitä ei kirjoita muistiin, eivät seikat palaudu mieleen enää viik- 
kojen tai kuukausien päästä. Erityisesti jos haastattelusta on tallennettu 
ainoastaan ääni eikä kuvaa, myöhemmin voi olla hankalaa päästä jäljille 
esimerkiksi siitä, mitä kolinaa taustalla kuuluu ja kenen kolmannen 
henkilön ääntä mukaan on tallentunut. Mikäli muistiinpanoissa lukee, 
että haastateltavan puoliso kävi haastattelun loppupuolella huoneessa 
hakemassa kenkiään ja kertomassa lähtevänsä asioille, tilanne on selvä. 
Jos haastattelujen keruu muodostaa laajemman kenttäretken, voi olla 
tarpeen pitää varsinaista keruupäiväkirjaa. 

Olennainen osa haastattelun jälkikäsittelyä on tallenteen litterointi. 
Litterointitapoja on useita, ja se, mitä tapaa käyttää, on ratkaistavissa sen 
perusteella, mitä haastatteluista tutkitaan. Puhutun kielen tutkimukses- 
sa on karkeasti kaksi eri litterointitapaa, joista ensimmäinen on muun 
muassa murteentutkijoiden ja variaationtutkijoiden käyttämä tapa, 
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jossa pyritään tarkkaan ääntämyksen transkribointiin (esim. suomalais- 
ugrilainen tarkekirjoitus, SUT). Näistäkin tarkekirjoituksista on mahdol- 
lista tehdä joko karkea tai puolikarkea litterointi. (Ks. esim. Yli-Paavola 
1970, 75-79; T. Itkonen 1997, 69-81; ks. myös Iivonen, Sovijärvi & 
Aulanko 1990, 53-60.) Muun muassa SU-transkriptiossa pyritään 
foneettisesti tarkkaan litterointiin, mutta sen sijaan siinä ei kiinnitetä 
huomiota esimerkiksi vuorovaikutuksen rakentumiseen (vierusparit, 
päällekkäispuhunta). 

Keskusteluntutkimuksessa (CA) käytetyssä transkriptiossa kiinnite- 
tään puolestaan huomiota muun muassa siihen, miten vuorot ja vierus- 
parit rakentuvat, mutta sen sijaan foneettisesti tarkekirjoitus on huo- 
mattavasti suurpiirteisempää (Hakulinen & Sorjonen 1986; ks. myös 
Raevaara & Seppänen 1989). Monissa nykytutkimuksissa litteraatiot 
ovat merkintätavoiltaan jossain määrin nimenomaisen tutkimuksen 
tarkoituksiin räätälöityjä tai rohkeamminkin edellä esitettyä kahta pe- 
rinnettä yhdistäviä versioita. Tämä käy, kunhan litteroinnin periaatteet 
on tutkimusaineiston esittelyn yhteydessä selkeästi kuvattu. 

Litterointitavasta riippumatta on tärkeää muistaa, että olemme puhe- 
kielen emmekä litteraatioiden tutkijoita. Olipa käytössä mikä tahansa 
tarkekirjoitusmenetelmä, litteraatti ei koskaan voi olla täydellinen pu- 
heen kuva. Paitsi että litterointitavat eroavat toisistaan, kullakin litte- 
roijalla on myös oma ”käsialansa”, johon vaikuttaa väistämättä myös 
litteroijan oma murretausta. Tyypillisesti litteroija on herkempi re- 
kisteröimään sellaisia vivahteita, joita hänen omassa idiolektissaan ei 
ole. Toisen tavun vokaalinpidennykseen (esim. lukutoukka; tässä tarke 
SUT-järjestelmän mukainen) kiinnittää herkemmin huomiota, jos ei itse 
ole savolaismurteiden alueelta kotoisin. Avartuneen diftongin merkin- 
nän kriteerit taas saattavat hämäläistaustaisella tutkijalla olla tiukemmat 
kuin itämurteisella tutkijalla. Tämä ei tarkoita, että litterointi olisi aineis- 
ton tutkimuskuntoon saattamisen menetelmänä jotenkin kestämätön. 
Havainto liittyy ainoastaan siihen, että jokaisen valmiiseen litteraattiin 
tarttuvan tutkijan on syytä selvittää, millaisen ohjeistuksen perusteella 
kyseinen litteraatti on tuotettu. Jos litteroija ei ole kiinnittänyt erityistä 
huomiota esimerkiksi yleiskielen d:n vastineisiin, on tämän vaihteluil- 
miön tutkijan varmasti syytä kuunnella kyseiset kohdat vielä uudestaan. 
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Erityisen korostunut tarkistusvastuu on silloin, kun tutkimuksen tar- 
koituksena on vertailu ja päätelmiä tehdään esimerkiksi diakronises- 
ta muutoksesta tai puhetilanteiden eroista. Näissä tapauksissa on aina 
varmistuttava, että havaitut erot ovat todellakin puhekielen eroja eivätkä 
eri litteroijien käsialojen eroja. (Ks. esim. Mustanoja & O'Dell 2007; 
Mustanoja 2011, 89.) 

Litteraatti kannattaa tehdä ohjelmalla, jossa ainakin äänisignaali ja 
litteraatti - mahdollisuuksien mukaan myös kuva — on mahdollista 
kohdistaa toisiinsa. Internetistä vapaasti ladattavissa ovat muun muas- 
sa puheanalyysiohjelmat Praat ja ELAN (ks. Praat; ELAN). Näiden oh- 
jelmien etu on erityisesti siinä, että litteraatiota tutkiessaan voi helposti 
kuunnella kyseisen kohdan, eivätkä varsinainen tutkimuskohde (puhe) 
ja litteraatti näin pääse erkanemaan toisistaan. Jos litteraatti on tehty 
tavallisella tekstinkäsittelyohjelmalla ja äänitiedosto on siitä täysin ir- 
rallaan, vaatii melkoisesti vaivaa etsiä aina kyseinen kohta tiedostosta 
kuunneltavakseen. Puheanalyysiohjelmat tuovat myös litterointivaihee- 
seen luotettavuutta ja sujuvuutta, sillä kuunneltavan kohdan voi ohjel- 
missa rajata tarkasti ja soittaa yhä uudelleen. Kokemus on osoittanut, 
että kuulokkeiden käyttö on litteroidessa aina ehdottoman suositeltavaa. 
Hyvistä laitteista huolimatta litterointi vie aikaa: yhden tunnin mittaisen 
äänitteen kunnolliseen transkribointiin kuluu kokeneelta tutkijalta hy- 
vinkin työpäivän verran aikaa. 


5. Yhteenveto: nykyiset käyttöalat ja 
-mahdollisuudet 


Haastattelumetodia voidaan käyttää kielentutkimuksessa ainakin kol- 
meen tarkoitukseen: 1) ensisijaisesti puhutun kielen materiaalin tuot- 
tajana (esimerkiksi dialektologiassa, variaationtutkimuksessa ja sosio- 
foneettisessa tutkimuksessa), 2) ensisijaisesti informaation tuottajana 
(esimerkiksi nimistöntutkimuksessa ja kansanlingvistiikassa) tai 3) ensi- 
sijaisesti yhden puhetilanteen tuottajana (esimerkiksi vuorovaikutuksen 
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tutkimuksessa ja variaationtutkimuksessa). Ideaalitapauksessa sama 
haastattelu voi palvella monenlaista tutkimusta; tarkentavia litterointi- 
kierroksia toki saatetaan tarvita useita kunkin tutkimuksen tavoitteiden 
mukaan. 

Suuri osa fennistisestä puhutun kielen aineistosta on haastattelemal- 
la kerättyä (ks. tietolaatikot 1 ja 2). Tämä ohjaa uutta tutkimusta kahteen 
suuntaan: Koska haastatteluaineistoa on paljon, on mielekästä kerätä 
aineistoa runsaasti myös muunlaisista puhetilanteista. Vertailtavuuden 
ja yleisen jatkuvuuden näkökulmasta taas on ehdottoman mielekäs- 
tä jatkaa myös haastattelujen tekemistä. Kuvaavimpina esimerkkeinä 
tästä jälkimmäisestä argumentista toimivat sosiolingvistiset reaaliaika- 
tutkimukset, joissa koko tutkimusasetelma pohjautuu mahdollisimman 
samoilla periaatteilla koostettujen eriaikaisten aineistojen vertailuun. 
Esimerkiksi useissa suomalaisissa haastatteluin aloitetuissa pitkittäis- 
seuruissa keruuperiaatteiden muuttaminen kesken kaiken ei tulisi ky- 
symykseen, sillä se romuttaisi tutkimuksen perustan — aineiston ver- 
tailtavuuden (ks. esim. Kurki 2005; Palander 2005; Paunonen 2005; 
Nuolijärvi & Sorjonen 2005; Mustanoja 2011). 

Haastattelut tarjoavat perinteisten käyttöalojensa lisäksi mahdolli- 
suuksia myös uusiin tutkimuksellisiin avauksiin (ks. myös Uusitupa 
2017, 78). Haastattelujen tyypillisesti hyvä äänenlaatu tarjoaa edellytyk- 
set esimerkiksi foneettisiin mittauksiin ja sen myötä vahvemmin sosio- 
foneettiseen tutkimusotteeseen. Henkilöhaastatteluissa toistuvat saman- 
kaltaiset aihepiirit taas mahdollistavat monenlaisen vertailun ja tarjoavat 
materiaalia esimerkiksi diskurssintutkimuksen tarpeisiin. Muun muas- 
sa kansanlingvistisessä tutkimuksessa haastattelut ovat saaneet vahvan 
roolin informaation tuottajina ja tarjonneet kosketuspintaa puhujien kä- 
sitysten ja heidän todellisen kielenkäyttönsä suhteeseen. Haastattelujen 
monipuolisen ja uudenlaisen käytön esteeksi voi oikeastaan muodostua 
vain liian kapea tai stereotypioihin rajoittunut kuva haastattelemalla ke- 
rätyn aineiston luonteesta. 

Se, että haastatteluita on käytetty jo varhaisessa dialektologisessa 
tutkimuksessa, saattaa virheellisesti johtaa ajatukseen haastattelusta 
ei pelkästään vanhana vaan myös jollakin tapaa vanhentuneena aineis- 
tonkeruun metodina. Menetelmän pitkäaikainen käyttö on kuitenkin 
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ainoastaan sen etu: haastatteluiden kohdalla olemme jo varsin hyvin 


perillä siitä, millaista materiaalia niillä saadaan kerättyä, millaisiin ling- 
vistisiin tutkimuksiin ne erityisesti sopivat ja mitkä taas ovat kielentut- 


kimuksen näkökulmasta menetelmän rajoitukset. Hyvällä tutkimusme- 
netelmällä ei ole parasta ennen -päiväystä, eikä se kulu käytössä. Silti 


hyvääkin menetelmää kannattaa säännöllisesti pysähtyä tarkastelemaan, 
ja sitä kannattaa aina myös pyrkiä kehittämään. 


TIETOLAATIKKO 1. 


Suomen kielen nauhoitearkisto (SKNA) 


perustettu vuonna 1959, nykyisin osa Kotimaisten kielten keskusta 
(Kotus) 

noin 24000 tuntia kielitieteellisiä äänitteitä suomen murteista, suo- 
men sukukielistä ja muista kielistä sekä kulttuurihistoriallisia äänit- 
teitä esitelmistä, akateemisista tilaisuuksista ja henkilöhaastatteluista 
arkiston aineistoja käyttävät kielentutkijoiden ja kieliaineiden opiske- 
lijoiden lisäksi myös kulttuurintutkijat, murteiden ja paikallishistorioi- 
den harrastajat sekä äänitettyjen kielenoppaiden jälkeläiset 

kaksi kolmasosaa aineistosta digitoitu (tilanne marraskuussa 2017) 
osa aineistosta käytettävissä myös Kielipankissa, jossa äänitteet ja 
niistä tehdyt litteroinnit on kohdistettu, eli niitä pystyy seuraamaan 


samanaikaisesti. 


https://www.kotus.fi /aineistot/puhutun kielen aineistot. 


TIETOLAATIKKO 2. 


Lauseopin arkisto (LA) 


perustettu valtion humanistisen toimikunnan kanssa tehdyllä sopi- 
muksella vuonna 1967 samaan aikaan Muoto-opin arkiston kanssa 
Lauseopin arkisto sijoitettu Turun yliopistoon, Muoto-opin arkisto 
Helsingin yliopistoon 
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e suomen kielen ensimmäinen sähköinen korpus, joka koostuu kaik- 
kiaan 132:sta morfologisesti ja syntaktisesti koodatusta aineistoyksi- 
köstä ja aineiston käytön mahdollistavasta ohjelmasta 

e 132 yksikköä murteita 

e kestoltaan noin tunnin mittaisista äänitteistä tehdyt litteroinnit, jotka 
on annotoitu morfologisesti ja syntaktisesti 

e käytettävissä Kielipankissa 

e 2000-luvulla Lauseopin arkiston alaisuuteen on liitetty useita muita 
sähköisiä annotoituja ja annotoimattomia suomen kielen korpuksia. 
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VIITTEET 


1 


Tutkimuskirjallisuudessa eri haastattelulajien nimitykset vaihtelevat. Strukturoimatonta 
haastattelua kutsutaan muun muassa avoimeksi haastatteluksi ja standardoimattomaksi 
haastatteluksi. Strukturoitua haastattelua on puolestaan nimitetty esimerkiksi standar- 
doiduksi haastatteluksi ja puolistrukturoitua puolistandardoiduksi haastatteluksi (Tiittula 
& Ruusuvuori 2009, 11-12). Tutkijoiden keskuudessa ei ole yhtenäistä tapaa määritellä 
niitä haastattelun lajeja, jotka sijoittuvat strukturoitujen ja strukturoimattomien haas- 
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tattelujen väliin. Esimerkiksi joidenkin tutkijoiden mukaan näiden ääripäiden väliin ovat 
erotettavissa osittain järjestelty ja osittain avoin haastattelu. (Hirsjärvi & Hurme 2000, 
49; Saaranen-Kauppinen & Puusniekka 2006.) 

2 Sosiolingvistiikassa haastattelut ovat olleet keskeinen aineistonhankintamenetelmä 
1970-luvulta lähtien. Tässä artikkelissa esitettäviä metodologisia perusperiaatteita on 
nähdäksemme mahdollista soveltaa monella muullakin lingvistisen tutkimuksen alalla. 

3 Vaihtoehtoisesti tässä yhteydessä voisi käyttää myös nimitystä murremaantiede kuten 
Chambers ja Trudgill (1998, 14) esitellessään perinteisen murteentutkimuksen keruu- 
menetelmiä. 

4 Esimerkiksi suomalaistutkijat pyrkivät kirjaamaan sanelun mukaan satu- ja tarinanäyttei- 
tä ja varsinaisten kirjattavien kielenainesten lähikontekstia. 

5 Esim. Kara Becker (2013) erottelee sosiolingvististä haastattelua esitellessään tiukan 
perinteisen merkityksen (engl. the sociolinguistic interview) ja väljän merkityksen (engl. 
sociolinguistic interview). 

6 Haastatteluesimerkkien litteroinnista ks. Mustanoja 2011, 86—87. Informanttien nimet 
ja muut henkilötietoihin viittaavat yksityiskohdat on tässä muutettu samoin kuin alku- 
peräislähteessä. 

7 Ylimääräinen esimerkiksi suhteessa ns. observoijan paradoksiin (Labov 1972a, 113, 209). 

8 Standardilla tarkoitetaan kyseessä olevan kielen normitettua kielimuotoa. Esimerkiksi 
suomen kielellä puhutaan ja kirjoitetaan eri tavoilla, mutta sen kirjakielellä on standardin 
asema. 

9 Silloinkin, kun hyödynnetään jo olemassa olevaa aineistoa, tutkimuskysymysten, -meto- 
dien ja -tulosten keskinäinen suhde on samanlainen. 
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Mika? 


Fonetiikka tutkii puhetta ja puheen ominaispiirteitä. Sitä voi pitää osana 
kielitiedettä tai aivan omana tieteenalanaan. Koska kaikkia ihmisen tuot- 
tamia ääniä ei pidetä puheena vaan ainoastaan kielellistä merkitystä kan- 
tavia ääniä, tutkimusalueen rajat riippuvat kielelle ja merkityksellisyydelle 
määritetyistä rajoista. Itse tutkimuskohdettaan, puhetta, fonetiikka tutkii 
kaikin mahdollisin keinoin. Perinteisessä kolmijaossa keinot jakautuvat 
akustisiin (itse äänisignaalia koskeviin), artikulatorisiin (äänen tuotta- 
mista koskeviin) ja auditiivisiin tai perseptuaalisiin (äänen havaitsemista 


koskeviin) menetelmiin. 
Katso myös: 


Johdannon luvut 3.1. Kieltä ei ole -teesi ja 3.2. Ontologia ja kielen- 


tutkimus 


Luku 24 Psyko- ja neurolingvistiikka 
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1. Johdanto 


Fonetiikkaan voi suhtautua niin kielitieteen yhtenä osa-alueena kuin 
omana itsenäisenä tieteenalanaan. Siinä tutkitaan puheen ja sitä tuot- 
tavien ja vastaanottavien järjestelmien yksityiskohtia. Puhe voi olla 
äänellistä tai viitottua. Tutkittavia yksityiskohtia ovat mm., mistä osista 
puhe koostuu, miten osat kytkeytyvät toisiinsa, mitä puhujassa ja hänen 
puhe-elimistössään tapahtuu puhetta tuotettaessa sekä miten kuulija 
vastaavasti havaitsee puheen ja käsittelee havaintoaan. Näitä seikkoja 
on kaiken kaikkiaan niin paljon, ne ovat niin monenlaisia ja vaativat 
niin erilaisia tutkimustapoja, että fonetiikan voi luontevasti katsoa myös 
kielitieteestä erilliseksi tieteenalaksi. 

Kielitiedettä ja fonetiikkaa yhdistävänä tekijänä on siis puhe, mut- 
ta fonetiikan ja kielitieteen näkökulma siihen voi olla hyvin erilainen. 
Jo kielitieteessäkin puheen käsitteen voi nähdä monin eri tavoin, mut- 
ta useimpia tapoja yhdistää kuitenkin ajatus puheesta yhtenä kielen 
muotona tai kielen konkreettisena toteutumana. Fonetiikan tutkijat sen 
sijaan eivät välttämättä sijoita kieltä asetelmaan ollenkaan (ainakaan 
millään yksinkertaisella tavalla): puhetta voidaan tarkastella omana it- 
senäisenä tutkimuskohteenaan ja sen mahdollistavia ja toteuttavia jär- 
jestelmiä osana nimenomaan puheen, ei abstraktimmin kielen, teoreet- 
tista ulottuvuutta. Yksi seuraus tästä on, että fonetiikka on kauttaaltaan 
sangen empiirinen tiede, jopa teoreettisimmillaan, ja muistuttaa siten 
usein pitkälti luonnontiedettä. Yksi tapa ajatella fonetiikkaa onkin nähdä 
sen kuuluvan niin ihmistieteisiin kuin luonnontieteisiin ja yhdistävän 
kummankin ajattelu- ja toimintatapoja. 

Suhteessa moniin kielitieteen menetelmiin fonetiikan menetelmät 
ovat usein hyvinkin invasiivisia. Tavat, joilla foneettista aineistoa ke- 
rätään, vaativat monesti tutkijaa tulemaan hyvin lähelle niitä ihmisiä, 
joiden puhetta tai puheentuottamis- ja vastaanottamisjärjestelmää tut- 
kitaan — ”tunkeutumaan” heidän normaaliin olotilaansa ja puhetoimin- 
taansa. Tutkija ei juurikaan pääse vetäytymään pois tilanteesta, jossa 
hän ja tutkittava ovat hyvin konkreettisesti läsnä. Tämä pätee jopa akus- 
tiseen fonetiikkaan (ks. luku 3.2.), koska foneettinen tutkimus asettaa 
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kerättävälle ääniaineistolle usein paljon tarkemmat laatuvaatimukset 
kuin ”tyypillinen” kielitieteellinen tutkimus. 

Fonetiikan menetelmien invasiivisuus osaltaan selittää, miksi tie- 
teenalaan on ajoin kohdistettu syytöksiä laboratoriotutkimuksesta eli 
tutkimuksesta, jonka aineistona ei ole todellinen kielenkäyttö. Foneeti- 
kon voi olla kielitieteilijääkin vaikeampi torjua observoijan paradoksi eli 
tutkimuksen vaikutus tutkittavaan. Fonetiikka ei tieteenalana niinkään 
väen väkisin ”pyri” laboratorioon, vaan sen on tutkimusmenetelmiensä 
ja tutkimuksen toistettavuuden takia sinne usein pakko mennä. Samas- 
ta syystä fonetiikka on usein jäänyt kuvaamaan monologista puhetta. 
Monologisuus ei ole osa fonetiikan kuvaa puheen luonteesta, mutta sitä 
on tutkittu dialogisia tilanteita enemmän tutkimusmenetelmällisistä 
syistä. Tutkimusalaan kuuluu sinänsä kaikki puhe, myös vuorovaikut- 
teiset puhetilanteet. 

Fonetiikalla on runsaasti eri menetelmiä, mikä seuraa luonnollises- 
ti sekä tutkimuskohteen moninaisuudesta että vaikeudesta tutkia sen 
muotoja. Tässä keskitytään esimerkinomaisesti menetelmistä vain 
joihinkin. 


2. Kokeellisen fonetiikan historiaa ja taustaa 
2.1. Historiaa 


Vaikka fonetiikka ja kielitiede on tieteen metodologiassa erotettu eri 
aloiksi vasta myöhään, 1800-1900-lukujen taitteessa, fonetiikkaa on tut- 
kittu yhtä pitkään kuin kieltä muutenkin. Tämä on tietysti luonnollista. 
Jos kieltä ylipäänsä aikoo tutkia, on pakko ottaa huomioon, että valtaosa 
siitä syntyy (edelleenkin) puheena ja että puhe on ensisijainen modali- 
teetti niin yksilön- kuin lajinkehityksessäkin. Sanojen muoto rakentuu 
ja merkityksiä välitetään niin usein äänteellisesti, ettei äänteellistä ulot- 
tuvuutta voi kokonaan ohittaa. 

Tietyssä mielessä voi itse asiassa väittää, että varhaisen (soveltavan) 
fonetiikan tutkimuksen merkittävin kehitysaskel on ollut puhutun 
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kielen muotoon perustuvien kirjoitusjärjestelmien — kuten käyttämäm- 
me latinalaisen kirjoituksen — kehitys. Hyvin pitkään kirjoitetun kielen 
antama malli ohjasi tutkimusta jopa siinä määrin, että yhä edelleen mo- 
net naiivit kielenpuhujat pitävät kirjainta ja äännettä samamerkityksisi- 
nä; esimerkiksi lapsesta sanotaan usein, että ”hän ei vielä osaa kirjain- 
ta s”, vaikka lapsi ei osaisi kirjoittaa lainkaan. Sama kirjainten malliin 
uskominen näkyy myös suuressa osassa nykyaikaista kielitiedettä (ks. 
esim. Linell 2005). 

Tieteenalan historiassa tekniikan kehityksellä on ollut suuri merkitys 
(ks. esim. Ashby 2017). Monesti uusia fonetiikan menetelmiä on syn- 
tynyt, kun aivan muuta päämäärää varten luotua tekniikkaa on keksitty 
soveltaa tutkimustarkoituksissa puheeseen. Hyvin suuri rooli on ollut 
esimerkiksi puhelintekniikan kehitystyöllä niin vanhojen lankapuhe- 
linten kuin nykyisten kännyköidenkin aikana. Koska puhelimitse siir- 
rettäessä ääni on yksinkertaisesti bittivirta, operaattorien on tavattoman 
tärkeä tietää, mikä datassa on oleellista ja mikä on mahdollista ohittaa 
viestinnän laadun merkittävästi kärsimättä. Puheäänen akustisten ja sen 
havaitsemisen auditiivisten ominaisuuksien tunteminen antaa esimer- 
kiksi mahdollisuuden pakata ääntä mahdollisimman tehokkaasti niin, 
että kaikki oleellinen signaalista kuitenkin välittyy, eivät pelkästään sanat 
vaan myös vaikkapa tieto puhujan identiteetistä. 

Jo varhaisimmissa kielitieteellisissä kuvauksissa kielen äänellinen 
puoli olikin läsnä. Länsimaiden antiikissa tutkimusta rajoitti ehkä eniten 
kielitieteen varsin filosofinen tutkimusote. Empiiristen menetelmien tai 
empiriaa koskevien havaintojen saatettiin kokea jopa loukkaavan kielen 
arvoa ihmisen ominaisimpana erityispiirteenä sekä ajattelun ja ajatusten 
välittämisen tärkeimpänä välineenä. 

Pitkään ei erotettukaan toisistaan kielen fonologiaa (merkitystä erot- 
tavien äänteiden tasoa) tai puheen fonetiikkaa (kaikkia puheeseen liit- 
tyviä ilmiöitä siitä riippumatta, erottavatko ne määräkielessä merkitys- 
tä tai eivät). Osaltaan tähän vaikutti kirjoituksen käyttäminen puheen 
mallina. Aivan kuten kirjoituksen myös puheen katsottiin koostuvan 
”kirjaimista”, toisin sanoen äänteistä, jotka tuotetaan yksi kerrallaan ja 
jotka seuraavat toisiaan enimmäkseen erillisinä segmentteinä, lomittu- 
mattomina sekventiaalisina elementteinä. Nykyään kuitenkin tiedetään, 
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että puhetta tuotettaessa puhe-elimistön tapahtumat paitsi lomittuvat 
myös mukautuvat toisiinsa jopa niin paljon, että joskus ne sulautuvat 
ajallisesti kokonaan yhteen. 1900-luvun loppupuolelta alkaen on myös 
yhä selvemmin tajuttu, että kirjoitus jättää valtaosin merkitsemättä yh- 
den puheen keskeisistä toimintarakenteista, prosodian, johon kuuluvat 
yleisen näkemyksen mukaan ainakin sävelkulku, kestot ja rytmi tai pai- 
notus. Prosodia on jo jonkin aikaa ollut yksi eniten uutta tutkimusta 
tuottavista fonetiikan osa-alueista. 

Nykyaikaisen tieteen kehyksessä fonetiikan kehityskulun voi sanoa 
alkaneen toden teolla 1700-luvulla. Tuolloin ei vielä ollut sellaisia tut- 
kimusvälineitä, joilla ääntä ja sen eri ominaisuuksia olisi voinut täysin 
objektiivisesti kuvata, joten foneettinen kuvaus tahtoi jäädä kuulovaiku- 
telmien ja niiden impressionistisen luonnehdinnan varaan. Tämä ei si- 
nänsä ole niin suuri rajoitus havainnoille kuin saattaisi kuvitella, koska 
tarkkakorvainen — käytännössä usein musikaalisesti lahjakas — kuulija 
voi tehdä puheesta varsin hienovaraisiakin havaintoja. Ongelma on en- 
nen kaikkea metodologinen: miten siirtää korvin havaittu tutkimustieto 
luotettavasti toisille tutkijoille? Tällainen havainnointi ei myöskään voi 
koskea artikulaatiota. Pelkän kinesteettisen, puhe-elimistön kulloistakin 
muotoa ja tilaa koskevan aistin varassa sitä on osoittautunut äärimmäi- 
sen vaikeaksi tavoittaa, eivätkä ihmisen ääntä koskevat havainnot kos- 
kaan ole suorassa suhteessa äänen akustisiin ominaisuuksiin. Tällainen 
tutkimustapa voi siis myös vääristää akustiikasta tehtyjä havaintoja. 

Merkittävä edistysaskel oli keksiä keinoja visualisoida puhetta eri ta- 
voin eli muuttaa se nähtäväksi, jolloin sitä saattoi myös luotettavammin 
mitata. Varhaisista tutkimusvälineistä kymografi keksittiin 1840-luvulla 
alun perin verenpaineen mittaamiseen, mutta sitä sovellettiin pian myös 
puheeseen (Suomessa esim. Äimä 1918a; 1918b). Koehenkilö puhui suu- 
kappaleeseen, painevaihtelut liikuttivat rummun kalvoa ja lopulta liikkeet 
piirtyivät nokipaperiin tasaisesti pyörivällä sylinterillä. Näin syntyneis- 
tä puhekäyristä saattoi jo mitata vaikkapa kestoja tai analysoida ääni- 
signaalia. Laite oli yleisessä käytössä pitkälle 1900-luvun alkupuolelle. 

Toinen merkittävä edistysaskel kokeellisen fonetiikan muotoutumi- 
sessa nykyiselleen oli äänentallennuksen keksiminen 1800-luvun lopul- 
la. Vasta kun ääntä saattoi tallentaa, samaa puhejaksoa oli mahdollista 
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kuunnella useita kertoja peräkkäin ilman, että se olisi puhujan tuotta- 
muksessa muuttunut. Koska kaikessa empiirisessä tutkimuksessa tois- 
tettavuus on yksi keskeinen kysymys, äänentallennus takasi mahdolli- 
suuden tehdä fonetiikasta entistä empiirisempää. 

Kolmannen edistysaskelen muodostavat ryhmänä kaikki ne tutkimus- 
välineet, jotka 1800-luvun lopusta alkaen ovat mahdollistaneet yhä 
uusien puhetapahtuman osatekijöiden empiirisen tarkastelun, esimer- 
kiksi artikulaation eri kuvantamismenetelmät (kuten röntgen; ks. luku 
3.1.) sekä lukuisat uudet, etenkin tietokoneaikana kehittyneet äänen 
akustiikan visualisoinnin ja käsittelyn tavat (ks. luku 3.2.). Kaikilla osa- 
alueilla tuotekehitys jatkuu vilkkaana, vaikkei sitä ensi sijassa ohjaakaan 
fonetiikan tutkimus vaan yleensä ulkoiset soveltavat syyt, kuten puheen- 
tunnistuksen tai tietokoneiden puhekäyttöliittymien kehitys. 


2.2. Filosofiaa ja kielikäsitys 


Foneettisia kuvauksia luonnehtivat jatkumot. Ihminen ei tarkalleen ot- 
taen koskaan "sano" esimerkiksi lyhyttä a- tai ä-vokaalia, vaan hän tekee 
tiettyjä asioita puhe-elimistöllään, joka jonkin ajan on jatkuvassa liik- 
keessä ja tuottaa toisen ihmisen kuultavissa olevaa, jatkuvasti muuttuvaa 
ääntä. Puhe-elimistö ei ole kuin auton vaihteisto, jossa on määräasemia 
määräasetuksille, sillä ei ole ennalta asetettuja tarkkoja ajallisia kestoja 
eri mittaisille puhesegmenteille, ja mikä tärkeintä, se ei juurikaan säilytä 
jotakin määrätilaa muuttumattomana pidempiä aikoja vaan on kaiken 
aikaa dynaamisesti liikkeessä.' Havaintokohteet, kuten ”äänteet”, ovat 
vain havainnon tuottama kuva tästä jatkuvasta saumattomasta muutok- 
sesta. Todellisuudessa puheelle leimallista on jatkuva muutos. 

Puheen toinen tunnusomainen piirre on koartikulaatio, ”myötä-ään- 
tyminen”. Puheen eri osat, kuten artikulatoriset liikkeet eli puhe-eleet, 
eivät esiinny ajallisesti yksi toisensa jälkeen kuin rakennuspalikat vaan 
suuressa määrin toistensa kanssa ajallisesti limittäin. Tässä puhe eroaa 
kirjoituksesta, jossa näyttää olevan vain lineaarisesti peräkkäisiä toisis- 
taan hyvin erotettavia yksiköitä, kirjaimia. Vaikka on totta, että yhden pu- 
hujan ääntämisen tuloksena syntyy äänisignaali eli ilmanpaine vaihtelee 
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lineaarisesti määräajan, saman voi sanoa esimerkiksi orkesterin soitta- 
masta musiikista. Silti siitä ei seuraa, että sinfonia olisi ajallisesti yksin- 
omaan lineaarinen tapahtumasarja. Joskus onkin sanottu, että puhe on 
pikemmin sinfonia kuin yhden instrumentin sooloesitys, ja puhujan 
artikulatorista ”suunnitelmaa” onkin kutsuttu partituuriksi.? 

Kaiken lisäksi tiedetään, että puheen osien keskinäiset ajalliset suh- 
teet muuttuvat joka tapauksessa kuulohavainnossa mm. siksi, että kor- 
keammat taajuudet havaitaan nopeammin kuin matalammat ja puheen 
eri osien prosessointi aivoissa kestää muutenkin eri aikoja. Kun edel- 
leen otetaan huomioon puheviestinnän kaikki osallistujat, on selvää, 
etteivät puheenvuorot ole yksiselitteisesti peräkkäisiä vaan usein pääl- 
lekkäisiä. Ääritapauksessa voi olla hyvin monta puhujaa tuottamassa pu- 
hetta samanaikaisesti, jolloin ei voi edes puhua puheenvuoroista (esim. 
mielenosoituksissa). 

Siinä missä (muu) kielitiede on pyrkinyt aina diskreetteihin, kate- 
gorisesti toisistaan erottuviin havaintokohteisiin (esim. suomessa a on 
eri asia kuin d tai sanat ratti ja rätti merkitsevät eri asioita), fonetiikka 
hyväksyy kaikkialla havaintokohteissaan dynaamisen jatkuvuuden, jota 
merkityksen välittäminen jollakin tavoin ohjaa (ks. myös kuvio 1). 


artikulatorinen : 
— : : akustinen t. — 
manipulaatio 
| Weed eese 
| \ 
artikulatorinen akustinen 
mittaus mittaus 


Artikulatorinen fonetiikka Akustinen fonetiikka — Auditiivinen fonetiikka 


Kuvio 1. Puheketju ja tutkijan mahdollisuudet manipuloida ja havainnoida sitä. 
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3. Fonetiikan menetelmiä 


Perinteisesti on ollut tapana jakaa fonetiikka kolmeen osa-alueeseen ns. 
puheketjun eri vaiheiden mukaan. Artikulatorinen fonetiikka keskittyy 
puheen tuottamiseen, akustinen fonetiikka itse puheääneen ja auditii- 
vinen tai perseptuaalinen fonetiikka puheen havaitsemiseen. Yhtä lailla 
tutkimusmenetelmät voi jakaa karkeasti kolmia sen mukaan, mitä pu- 
heketjun vaihetta tutkija havainnoi tai mittaa, eli artikulatoriseen, akus- 
tiseen ja perseptuaaliseen tutkimukseen. 


Fonetiikka ja viittomakieli 


Viittomakielessä on vastaavat puheketjun vaiheet, vaikka perinteinen 
terminologia (mukaan lukien sana fonetiikka < kr. fone ’aani’) viittaa pu- 
huttuun kieleen. Viittomakielen tutkimuksessa on joskus puhuttu esim. 
optisesta fonetiikasta akustisen sijaan. 


Toisinaan tutkija vain havainnoi puhetta ja puhetilanteita eikä pyri te- 
kemään järjestelmällisesti kontrolloituja kokeita. Tällöin kiinnostuksen 
kohteena on havaittujen aspektien eli havaintomuuttujien keskinäiset 
riippuvuussuhteet. Tiukemmassa mielessä kokeellinen-sanaa on tulkittu 
niin, että tutkija itse järjestelmällisesti manipuloi joitakin tutkittavan 
ilmiön piirteitä, ns. kontrolloituja tai kontrollimuuttujia, ja havainnoi 
toisia piirteitä selvittääkseen näiden mahdollisia keskinäisiä vaikutus- 
suhteita? Kun tutkija kontrolloi jotakin ominaisuutta, hän pyrkii var- 
mistamaan, ettei ominaisuus riipu — ainakaan sillä kertaa — muista ha- 
vaintoseikoista. Fonetiikan tutkimusmenetelmiä voi siis luokitella myös 
sen mukaan, manipuloiko tutkija puhetapahtumia järjestelmällisesti vai 
ei, ja jos manipuloi, missä kohtaa puheketjua tutkija niiden kulkuun 
vaikuttaa mahdolliset seuraukset nähdäkseen. 

Tutkimuksen ajassa mahdollinen manipulointi aina edeltää havain- 
nointia. Siitä ei silti seuraa, että manipulaatio puheketjukaaviossa aina 
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sijaitsisi havainnoinnin vasemmalla puolen, koska kuvion 1 hahmot- 
telemasta puheketjumallista poiketen todellinen puhevirta ei ole li- 
neaarinen prosessi, jossa on selvä alku ja loppu, vaan se on (vähintään) 
syklinen. Periaatteessa minkä tahansa vaiheen ilmiö voi vaikuttaa mihin 
tahansa tulevaan vaiheeseen. 

Fonetiikka tutkii äänen käyttöä kielellisessä viestinnässä. Toisella ta- 
voin ilmaisten kohteena on äänen ja merkityksen suhde.t Foneettises- 
sakin tutkimuksessa olennainen muuttuja on näin ollen jollakin tapaa 
operationaalistettu merkitys. Toisaalta fonetiikassa merkitystä tyydytään 
käsittelemään hyvin epämääräisesti eikä pyritä analysoimaan merkitys- 
rakenteita tai merkitysten kompleksisia suhteita. Yleensä riittää, että 
tutkija pystyy arvioimaan, onko kahden annetun puhunnoksen merkitys 
sama (tai samankaltainen) vai ei. 

Merkityseron toimiessa kontrolloituna muuttujana koehenkilöitä 
voidaan ohjeistaa käyttäen kielen omaa oikeinkirjoitusta (ortografiaa), 
jos halutut merkityserot selviävät sen avulla. Joskus tutkijan täytyy olla 
kekseliäämpi. Esimerkiksi jos haluaa tutkia, onko suomen kielen ääntä- 
myksessä eroa merkitysten ”kurkku (ruumiinosa) ja ”kurkku (vihannes)’ 
välillä, tilanne on hankalampi, koska merkitys toimii havaintomuuttuja- 
na. Jollakin tarkkuudella tutkija voi yrittää arvioida, mitä puhuja tarkoitti 
ja miten kuulija kuulemansa tulkitsi, mutta on selvää, että tällainen ar- 
viointi on subjektiivista ja altista virheille. Kummassakin tapauksessa on 
käytännössä usein mahdollista korvata ”merkitykset” sanoilla tai muilla 
oletetuilla kielellisillä yksiköillä. 


3.1. Artikulatorinen tutkimus 


Fonetiikan vanhin ja luultavasti useimmille alan ulkopuolisille yhä tu- 
tuin tarkastelukulma on artikulatorinen. Siinä huomio kiinnittyy sii- 
hen, mitä puhujan puhe-elimistössä puhetta tuotettaessa tapahtuu. 
Artikulaatio suomentuu periaatteessa ”ääntämiseksi”, mistä helposti 
seuraa väärinkäsitys, että artikulatorinen fonetiikka liittyisi jotenkin 
”oikeaan” tai ”kunnolliseen” ääntämykseen kuten puhetaidon oppais- 
sa. Fi-preskriptiivisenä tieteenä fonetiikkaa kiinnostaa kuitenkin kaikki 
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ääntäminen samoin kuin ääntämiseen liittyvät muut fysiologiset tapah- 
tumat, kuten hengittäminen ja lihaskontrolli. 

Artikulaation empiiriseen tutkimukseen on ollut historiallisesti hel- 
pointa tarttua, koska jokaisella kielenpuhujalla on hallussaan ja varsin 
pitkälle hallinnassaan se elimistö, jossa puhe syntyy. Ihminen on myös 
sangen etevä matkimaan omassa puhe-elimistössään toisen ihmisen 
tuottamaa puhetta. Artikulaatiota voi kuitenkin vain rajallisesti tutkia 
matkimalla kuultua puhetta ja yrittämällä kinesteettisen tuntuman 
perusteella arvioida puhe-elimistön muotoa. Ensinnäkin tuntuma voi 
valehdella — minkä säilyneet varhaiset artikulatoriset kuvaukset armot- 
ta nykytutkijalle paljastavat —, ja toisekseen jo tieteellisen tutkimuk- 
sen luonne tapaa vaatia tutkijaa olemaan liikaa luottamatta itseensä 
havaintokohteena. Toisen henkilön puhe-elimistön havainnoiminen 
edellyttää välineitä tai vähintäänkin tutkimusolosuhteita, jotka tunkeutu- 
vat syvälle tutkimuskohteena toimivan ihmisen normaaliin toimintaan, 
eivätkä voi jollakin lailla olla vaikuttamatta siihen. Tutkimusvälineet tah- 
tovat aina jonkin verran haitata puhetta. 

Tyypillisen artikulatorisen tutkimuksen rakenne. Artikulatorisessa 
tutkimuksessa ääntämisen seuranta tyypillisesti edellyttää koehenkilöjen 
tulevan (pysyvään tai väliaikaisesti rakennettuun) laboratorioon, jotta eri 
mittauslaitteet olisivat käytettävissä. Monet menetelmät ovat koehen- 
kilöille verraten raskaita, eikä niitä voi käyttää kovin pitkään kerralla. 
Havainnointiaika on näin ollen rajallinen, joten ei ole mielekästä jäädä 
odottamaan, että tutkijaa kiinnostavia puhetapahtumia tapahtuisi spon- 
taanisti. Tyypillisesti koehenkilöitä pyydetäänkin lukemaan ennalta mää- 
rättyjä tekstejä, esimerkiksi sanalistoja, lauseita tai kokonaisia tekstejä. 
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Lip onset = 
zero lip aperture velocity 


=. tipa 


sof aperture 


Tongue body horizofftal 
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S 


20L Tongue body ype 


Tongue body speed 


fi 
125.0 125.5 | 126.0 


Tongue onset = 
minimum tongue body speed 


Kuvio 2. Esimerkki artikulaatiomittauksista: huuliaukko, kielen selkä (sijainti 
pysty- ja vaakasuunnassa sekä selän nopeus) (O'Dell, Simko, Nieminen, Vainio, 
Lehtinen 2011). 


Puhetta voi yrittää maanitella luonnollisemmaksi niin, että pyytää koe- 
henkilöä painamaan annetun tekstin ensin mieleensä ja sitten ääntä- 
mään sen ilman kirjallista tekstiä. Tyypillisesti mittauslaitteisto syn- 
nyttää jatkuvasti muuttuvaa signaalia, esimerkiksi seuraa koehenkilön 
jatkuvia artikulatorisia liikkeitä. Koehenkilön puhe on hyvä samanaikai- 
sesti äänittää siten, että äänen ja artikulaatiotietojen tahdistus eli synk- 
ronointi on jälkeenpäin mahdollista. Koehenkilön puheesta on myös 
yleensä helpompaa löytää tutkimuksen kannalta kiinnostavia vaiheita 
äänitteen avulla. Lisäksi äänitteen avulla voi tarkistaa, onko koehenkilö 
todella tuottanut, mitä pyydettiin. 

Koska eri puhujat ovat joka tapauksessa anatomisesti erilaisia, artiku- 
latoriset mittaukset eivät suoraan ole vertailukelpoisia yksilöstä toiseen. 
Eri ääntämyksiä on silti mahdollista vertailla ottamalla yksilön anatomia 
huomioon. Voidaan esimerkiksi todeta, äännetäänkö i-vokaali jarjestel- 
mällisesti eri tavoin kahdessa eri kontekstissa. 

Artikulatorisia mittauksia. Yksinkertaisimpia artikulaation havain- 
noinnin tapoja ovat valo- ja videokuvaus sekä tutkijan oma (kinesteetti- 
nen eli liikeaistituntumaan perustuva) havainnointi. Koska artikulaatio 
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tapahtuu oleellisesti katseilta piilossa, eri kudosten alla, kaksi ensim- 
mäistä tapaa tuottavat luonnollisesti rajallisesti tutkimustietoa. Tutki- 
jan omaan tuntumaan perustuvan havainnoinnin rajoittuneisuus on 
puolestaan paljastunut jo fonetiikan historiassa, puhumattakaan siitä, 
että tutkijan asettuminen omaksi tutkimuskohteekseen on aina metodo- 
logisesti epätyydyttävä ratkaisu. 

Röntgenkuvaus oli yksi ensimmäisiä merkittäviä tekniikoita paljas- 
taa artikulaation katseelta piiloon jäävät tapahtumat. Röntgeniin liittyy 
kuitenkin suuria ongelmia. Ilmeisin niistä on nykyään hyvin tiedossa: 
röntgensäteily on suurina tai pitkittyneinä annoksina tutkittavan tervey- 
delle haitallista, mistä syystä röntgenin käyttö välineenä on merkittävästi 
vähentynyt koko toisen maailmansodan jälkeisen ajan. Silti sen voi edel- 
leen katsoa antavan parhaan ja tarkimman kuvan artikulaatioelimistä 
artikulaation aikana. 

Terveyshaitat eivät ole kuvantamismenetelmän ainoa ongelma. En- 
sinnäkin puhe-elimistö koostuu suurelta osin pehmytkudoksesta, joka 
ei näy röntgenissä niin hyvin kuin kovat kappaleet kuten luut ja ham- 
paat. Mitä pienemmistä pehmytkudososista on kyse, sitä huonommin 
ne röntgenissä näkyvät; tärkeimmän artikulaatioelimen kielen saa suu- 
rena lihaksena kuvassa kuitenkin näkyviin onneksi varsin hyvin. Toinen 
ongelma on se, että röntgenkuva on kaksiulotteinen projektio kolmiulot- 
teisesta artikulaatioavaruudesta eli litistetty kuva, jossa ei voi yhtä aikaa 
saada näkymään kaikkia ulottuvuuksia. Usein käytetään vain sivu- eli 
profiilikuvakulmaa. Tarkastelua voisi helpottaa, jos olisi mahdollisuus 
samanaikaisiin röntgenkuviin useammasta kuvakulmasta, mutta tämä 
lisäisi säteilyannostusta entisestäänkin ja on siten yleensä mahdoton 
toteuttaa. Lisävaikeuden muodostaa alaleuan luun suuri, näkyvyyttä 
haittaava massa. Toisaalta röntgenkuvaus on mahdollista myös videona, 
jolloin aikaulottuvuus saadaan mukaan. 

Röntgenin sijaan voi käyttää muita läpäiseviä menetelmiä, esimer- 
kiksi ultraääntä. Ultraäänellä ei ole samanlaisia haittoja kuin röntgen- 
säteilyllä, mutta sen antama kuva on vastaavasti epätarkempi ja vaa- 
tii tarkempaa tulkintaa. Kuten röntgeniä myös ultraääntä voi käyttää 
joko staattisina kuvina tai videona, mutta röntgeniin verrattuna ultra- 
äänivideo voi huomattavasti helpottaa tulkintaa: mikä yksittäisessä 
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tilannekuvassa jää epäselväksi, saattaa elävästä kuvasta käydä parem- 
min ilmi. Ajallinen erotustarkkuus röntgenissä ja ultraäänessä on samaa 
luokkaa eli kummallakin pystyy tarkastelemaan myös varsin lyhytkestoi- 
sia tapahtumia. 

Yleisesti ottaen kaikkien läpäisevien kuvausmenetelmien ongelma- 
na on kiintopisteiden asettaminen tarkasteltaville puhe-elimille. Esi- 
merkiksi kielen nousu voi johtua paitsi siitä, että puhuja nostaa kieltä, 
myös siitä, että puhuja muuttaa päänsä asentoa niin, että liikkumatto- 
mana suussa pysynyt kieli nousee. Koska koko puhe-elimistö — ainakin 
sen supraglottaalinen osa eli kaikki kurkunpäästä ylöspäin — sijaitsee 
hyvin liikkuvassa osassa ihmisvartaloa, kiintopisteiden asettaminen 
voi olla hankalaa ja edellyttää joko kuvantamislaitteiston kiinnittä- 
mistä tiukasti määräasentoon suhteessa päähän (ks. kuva 1) tai pään 


Kuva 1. Ultraäänilait- 
teisto kiinnitystelinei- 
neen. Signaali siirtyy 
analyysia varten tieto- 
koneelle. 
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kiinnittämistä tiukasti mittauslaitteistoon; kumpikin tapa tekee infor- 
mantin olosta enemmän tai vähemmän epäluonnollisen, mikä voi hei- 
jastua puheeseen. 

Elektromagneettinen artikulografia (EMA) ratkaisee ongelman siten, 
että samanaikaisesti seurataan pään liikkeitä ylimääräisillä sensoreilla, 
jotta mittausten jälkeen voidaan laskea artikulaattoreiden liikkeitä suh- 
teessa pään liikkeisiin. Tässä mittaustekniikassa kiinnitetään sensoreita 
väliaikaisella liimalla tutkittaviin kohtiin, esim. huuliin, kielen kärkeen, 
laiteisiin, lapaan ja selkään, ylä- ja alahampaisiin tai mahdollisesti kita- 
purjeeseen. Laitteisto pystyy seuraamaan sensorien liikkeitä, kunhan 
sensorit pysyvat noin kuutiometrin kokoisen kehyksen tai häkin sisällä, 
jonka kulmissa on voimakkaat kestomagneetit.5 Tyypillisesti sensorit 
kiinnitetään myös korvien taakse ja nenän yläpuolelle pään liikkeiden 
seurantaa varten. Artikulografia välttää ultraäänikuvantamiselle tyypilli- 
sen ongelman pään fyysisestä kiinnittämisestä johonkin ulkoiseen ke- 
hykseen, mikä vähentää tutkimustavan invasiivisuutta, mutta toisaalta 
tutkimushenkilö on sijoitettava suureen häkkiin ja hänen suuhunsa on 
kiinnitettävä sensorit johtoineen, jotka ohuudestaan huolimatta suusta 
ulos pistävinä ja huulta vähäisellä mutta havaittavalla massallaan paina- 
vina eivät voi olla jonkin verran vaikuttamatta puhujan artikulaatioon. 
EMA-laitteisto on Suomessa käytössä ainoastaan Helsingin yliopistossa. 

Fi-läpäiseviä artikulatorisia tutkimusmenetelmiä ovat palatografia ja 
labiografia. Niihin ei sisälly suoranaisia terveysriskejä, mutta ne myös 
rajoittuvat tuottamassaan tutkimustiedossa yhteen ääniväylän osaan: 
palatografia kitalaen ja kielen kosketukseen, labiografia huuliin. Van- 
hastaan palatografiasta puuttui täysin aikaulottuvuus eikä se myöskään 
sallinut tutkia pidempiä puhejaksoja, mutta nykyisin dynaamisella eli 
elektropalatografialla voi kerätä jatkuvaa ajallista tietoa siitä, missä kieli 
koskettaa kitalakea. Myös palatografia on niin perinteisessä kuin nyky- 
muodossaankin varsin invasiivinen tekniikka, joka ei salli luonnollisia 
puhetilanteita ja vaatii koehenkilöltä yhteistyöhalukkuutta. 

Fi-läpäisevänä voinee pitää myös elektromyografiaa (EMG) eli lihas- 
ten sähköisen toiminnan havainnointia. Puheentutkimuksen tekniik- 
kana se on jo vanha ja vakiintunut. Menetelmä tuottaa tietoa artikulaa- 
tiolihasten toiminnasta, mistä edelleen voi epäsuorasti päätellä seikkoja 
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myös artikulaatioelinten kulloisestakin asemasta. Sen erityisansiona voi 
pitää sitä, että se tuottaa tietoa puhe-eleestä sen luontaisilla yksiköil- 
lä eli se astuu askelen taaksepäin puheketjussa muihin mainittuihin 
kuvantamismenetelmiin verrattuna suomalla näkymän siihen, mitä eli- 
mistössä tapahtuu juuri ennen havaittavaa artikulaatiota. 

Yksi hankalimmista artikulatorisista tutkimuskohteista on kurkunpää 
sointia tuottavine äänihuulineen. Tutkittavaksi on vaikea saada esimer- 
kiksi puhdasta sointiääntä eli äänen sointia sellaisena kuin se kurkun- 
päästä lähtee ilman, että kurkunpään yläpuolinen ääniväylä resonanssi- 
ominaisuuksineen vaikuttaisi siihen. Vaikka mikrofoni kiinnitettäisiin 
kaulaan kurkunpään kohdalle, resonansseilla voi silti olla merkittävästi 
häiritsevä vaikutus. Yhtenä ratkaisuna on ollut käyttää kuolleen ihmisen 
kurkunpäätä, jonka voi irrottaa tutkittavaksi erikseen tuottamalla ilmavir- 
ran sen läpi. Tällöin kuitenkin saadaan selville lähinnä kurkunpää-äänen 
fyysiset rajat, ei sen dynaamisia ominaisuuksia eikä ennen kaikkea sitä 
lihaskontrollia, jolla elävä ihminen kurkunpää-ääntään puheen osana 
käyttää. Edelleen äänihuulten värähtely on niin nopeaa — taajuus jopa 
satoja kertoja sekunnissa -, ettei kaikkien kuvantamismenetelmien aika- 
erotuskyky ole vallankaan aiemmin riittänyt sen tallentamiseen. Nykyisin 
suurinopeusvideokuva on kuitenkin jo arkipäivää, joten ongelmaksi jää 
lähinnä saada kamera kuvaamaan kaulan lihasten ja muiden kudosten 
sekä varsin tukevien rustorakenteiden taakse piiloutunutta tapahtumaa. 
Käytettyjä tekniikoita ovat mm. röntgenkuvantaminen (edellä mainit- 
tuine ongelmineen), koehenkilön kannalta varsin invasiivinen tähystys- 
kamera tai 1950-luvulla kehitetty elektroglottografia, jossa johdetaan 
suuritaajuuksinen sähkövirta kurkunpään lävitse ja mitataan muutokset 
sen impedanssissa. Kaikissa tutkimusmenetelmissä on puutteensa. 

Muista menetelmistä on mainittava ilmanpaineen ja -virtauksen mit- 
taus. Kumpikin mittaus on periaatteessa mahdollista tehdä täysin ulkoi- 
sesti, mutta käytännössä ne kuitenkin tapaavat edellyttää varsin ankaraa 
invasiivisuutta. Esimerkiksi suu- ja nenäaukon peittävä (oronasaalinen) 
ns. Rothenberg-maski on yksi tällainen apuväline. Menetelmän ajallinen 
erottelukyky ei kuitenkaan riitä yksittäisten äänteiden tarkkailuun. 

Artikulatorisia manipulointimahdollisuuksia. Olisi ihanteellista, jos 
puhuja pystyisi tarkoin ja pienin askelin varioimaan omia artikulatorisia 
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liikkeitään ja lihastensa käyttöä, jotta voitaisiin tarkkailla seurauksia 
akustiikassa tai havainnossa. Puhujalla ei ole kuitenkaan tällaisia kykyjä. 
Artikulaatio muuttuu jopa silloin, kun puhuja tietoisesti pyrkii ääntä- 
mään saman puhunnoksen täsmälleen samalla tavalla. 

Luultavasti nykyään tavallisin tapa kiertää tämä este on korvata oikea 
puhuja artikulatorisella synteesillä. Siinä puhetta tai tarkemmin puheen- 
kaltaista ääntä tuotetaan tietokoneohjelmalla, joka mahdollisimman tar- 
kasti pyrkii mallintamaan ihmisen puheentuottamismekanismia. Etuna 
oikeaan ihmiseen verrattuna on se, että mallia voi säätää luotettavasti ja 
pikkutarkasti esimerkiksi lisäämällä tietyn lihaksen supistusvoimaa, ja 
ohjelman synnyttämää akustista tulosta voi tarkkailla sellaisenaan tai 
esimerkiksi soittaa (ihmis)kuulijoille havaintokokeessa. Mallia voi jopa 
säätää tavalla, joka olisi ihmiselle mahdotonta, esimerkiksi suurenta- 
malla ja pienentämällä eri anatomisia osia, jotta nähtäisiin, miten ih- 
misten luonnolliset anatomiset erot vaikuttavat ääneen. Haittapuolena 
on tietenkin se, ettei malli kuitenkaan koskaan ole todellinen ihminen 
eikä kaikkia olennaisia artikulatorisia seikkoja ole välttämättä kyetty ot- 
tamaan huomioon. Artikulatorisen synteesin kehittäminen edellyttääkin 
edeltävää tietoa nimenomaan oikean ihmisen artikulaatiosta. 

Oikean puhujan manipulointiin on monia mahdollisuuksia, esimer- 
kiksi purentakappale (engl. bite-block; esim. Fowler & Turvey 1980), 
puhuminen oudolla tavalla (esim. suu tiukasti kiinni), puheen toista- 
minen vain toistuvaa tavua käyttäen (engl. reiterant speech; esim. Kelso, 
Vatikiotis-Bateson, Saltzman & Kay 1985) jne. Ihmisellä on varsin häm- 
mästyttävä kyky tuottaa ymmärrettävää ja jopa varsin oikealta kuulos- 
tavaa puhetta myös eri tavoin häirittynä, mikä osoittaa oivasti, kuinka 
puhujalla on hallittavissa oleva malli paitsi omasta ääntöelimistöstään 
myös sen ja havaintovasteen suhteesta. 

Samoin on osoitettavissa, että puhuja käyttää eri palautekanavia pu- 
heentuottonsa monitorointiin. Jos palautejärjestelmää häiritään, puhuja 
tyypillisesti ”korjaa” artikulaatiotaan, vaikka korjaus lopullisen puhe- 
tuotoksen kannalta saattaa häirinnän vuoksi nimenomaan osua vikaan. 
Keinoja ovat esimerkiksi väliaikainen puuduttaminen, kohinan toista- 
minen puheen aikana sekä viivästetty äänipalaute (engl. delayed audio 
feedback eli DAF), jossa puhujan korviin soitetaan hänen omaa ääntään 
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jonkin verran viivästettynä, jolloin puhujan oma lihastuntuma ja hänen 
havaintonsa omasta äänestään ajautuvat ristiriitaan. 


3.2. Akustinen tutkimus 


Akustinen tutkimus tutkii itse (puhe)ääntä fysikaalisena ilmiönä, jolloin 
koehenkilön ei enää tutkimusdataa kerättäessä ole välttämätöntä olla 
läsnä. Itse äänidata on tietenkin silti kerättävä koehenkilöiltä, ja koska 
foneettinen tutkimus luonteeltaan tarkastelee hienovaraisia jatkumoita 
ja moninaisten piirteiden keskinäistä dynamiikkaa, käytettäville äänit- 
teille asetetaan usein — vaikkei välttämättä aina — tiukemmat laatuehdot 
kuin suuressa osassa muuta kielentutkimusta. Ei riitä, että tutkija saa 
sanoista selvää, vaan hänen on voitava havainnoida niitä ilmiöitä, jotka 
mahdollistavat puheen, tai yhtä hyvin, jotka vaikeuttavat sitä. 
Äänityksen laatuun vaikuttavat monet tekijät. Osa on peräisin lait- 
teistosta, jolloin tutkija voi vaikuttaa niihin ainoastaan valitsemalla pa- 
rempilaatuisia laitteita. Tällainen ominaisuus on esimerkiksi laitteen 
taajuusvaste eli se, kuinka luotettavasti äänite tallentaa alkuperäisen 
äänen kaikkia taajuusalueita suhteessa toisiinsa. Osa häiriötekijöis- 
tä taas aiheutuu äänitysympäristöstä ja laitteiden käytöstä. Niihin voi 
äänitystilanteessa mahdollisesti vaikuttaa. Näihin kuuluvat esimerkiksi 
ulkoisten häiriöäänten määrä ja signaali-kohinasuhde. Lisäksi koska 
ääntä käsitellään nykyisin yleensä tietokoneella, on otettava huomioon 
tekijät, jotka aiheutuvat luonteeltaan analogisen (jatkumonluonteisen) 
äänisignaalin digitoimisesta tietokoneen käsiteltävissä olevaan muotoon. 
Edelleen on huomattava, että itse digitoijan? laatu voi myös vaikuttaa sii- 
hen, kuinka luotettavasti digitaalinen äänidata vastaa alkuperäistä ana- 
logista signaalia. Moniin tekijöistä voi olla hyvin vaikea vaikuttaa. Laite- 
valmistajien lupauksiin ei kannata sokeasti luottaa, vaan on tarkistettava, 
mitä esimerkiksi lehtien testit laitteiden laadusta ovat paljastaneet. 
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Laatutekijät äänen digitoinnissa 


Äänen digitoimisessa on helppo tehdä karkeita virheitä. Seuraavat neljä 
tekijää kannattaa tarkistaa yleisten laatutekijöiden ohella. 


Näytteenottotaajuus. Kuinka usein äänisignaalista otetaan näyte. 
Musiikki-CD-levyjen näytteenottotaajuus on 44,1 kHz (44 100 kertaa se- 
kunnissa), joka riittää kuvaamaan taajuusalueen 0-22,05 kHz. Suurin 
osa puheen informaatiosta löytyy taajuudelta 0-10 kHz, joten tämä stan- 
dardiksi muodostunut taajuus hyvin riittää puheen tutkimiseen. 


Bittisyys. Kuinka suurta binaarilukua käytetään kuhunkin näytteeseen. 8 bit- 
tiä riittää 256:een eri tasoon, 16 bittiä 65 536:een jne. Mitä vähemmän taso- 
ja on käytettävissä, sitä pienempi on näytteen hiljaisimman ja voimakkaim- 
man äänen välinen ero. 16-bittinen äänitys on riittävä puheen tutkimiseen. 


Pakkaus. Monet äänentallennuslaitteet pakkaavat ääntä automaattisesti. 
Pakkaaminen vähentää äänisignaalin dataa niin, että auditiivinen vaiku- 
telma säilyy mahdollisimman samankaltaisena. Tutkimustarkoituksiin 
kerätyssä äänessä pakkaaminen aiheuttaa yleensä ennakoimattomia on- 
gelmia, joten pakkausta on syytä välttää. 


Äänitystaso. Etenkin digitaalisessa äänityksessä on tärkeää säätää 
äänitystasoa siten, ettei digitoinnin katto ylity (ainakaan liian usein), 
koska tällöin informaatiota katoaa. Toisaalta ei ole suositeltavaa käyt- 
tää joidenkin laitteiden tarjoamaa automaattista voimakkuuden säätöä 
muun muassa siksi, että silloin asetus vaihtelee ajan myötä eikä taso 
siten ole vertailukelpoinen näytteen sisällä. 


Puhe-elimistössä syntyneen puheäänen tutkiminen muuten kuin impres- 
sionistisesti vaatii laitteita, joilla visualisoida ääntä ja mitata sen ominais- 
piirteitä. Akustiikan tutkiminen ei sinänsä vaadi puheen tuottaneen hen- 
kilön läsnäoloa; tässä mielessä akustinen tutkimus vapauttaa koehenkilön 
laboratoriosta. Toisaalta fonetiikan tarpeisiin sopiva akustinen aineisto on 
usein laatuvaatimusten takia äänitettävä olosuhteissa, jotka ovat tiukan 
laboratoriomaiset eivätkä siten suosi vapaata, luonnollista puhetta. 
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Vielä pitkälle yli 1900-luvun puolenvälin akustiikkaa visualisoivat 
järjestelmät olivat kalliita ja mutkikkaita erikoislaitteita, joita saattoi 
löytää lähinnä tutkimuslaitoksista. Henkilökohtaisten tietokoneiden 
kehityksen myötä tilanne muuttui nopeasti. Alkuun tosin tilanne 
muuttui vain sikäli, että vaikka äänen akustiseen tutkimukseen sovel- 
tuva laite — tietokone, johon voi syöttää ja josta voi saada ulos ääntä 
— oli helposti saatavilla, visualisoinnin tekevät ja mittaukset mahdol- 
listavat ohjelmat olivat yhä kalliita ja harvojen ulottuvilla. Tämäkin ti- 
lanne helpottui oleellisesti 1990-luvulla, kun ilmaisesti verkossa jaet- 
tava Praat-ohjelma (Boersma & Weenink 1996; 2018) tuli saataville. 
Nykypäivänä puheketjun akustinen vaihe lienee helpoin vaihe tehdä 
havaintoja tai manipulaatioita. Vähimmäislaitteistoksi riittää tietokone 
ohjelmistoineen. 

Tyypillinen akustinen tutkimus. Akustisesta tutkimuksesta esimerk- 
kinä toimii vokaalien formanttimittaus. Akustisesti vokaalit eroavat 
toisistaan formanteiltaan, jotka ovat vokaalin äänen spektrissä verraten 
voimakkaita taajuusalueita, jotka aiheutuvat ääniväylän resonansseista 
kurkunpäässä syntyneen äänen kulkiessa sen läpi. Resonanssit riippuvat 
ääniväylän kulloisestakin muodosta, mm. kielen ja huulten asennosta, 
mikä selittää, miksi formantit ovat vokaalien kannalta niin olennainen 
akustinen piirre: ne paljastavat epäsuorasti ääniväylän muodon eli puhe- 
elinten konfiguraation. Varsinkin kaksi alinta formanttia (F1 ja F2) ja 
vähemmässä määrin seuraavakin (F3) ovat osoittautuneet tärkeiksi vo- 
kaalien erottelussa. 

Tavoitteena tutkimuksessa voi olla selvittää esimerkiksi, paljonko 
jonkin kielen vokaalit eroavat toisistaan akustisesti. Eräs haittatekijä on 
puhujien muodoltaan eroavat ääniväylät, mistä seuraa, ettei formantti- 
mittauksia voi suoraan verrata yksilöstä toiseen. Varsinkin ääniväylän 
kokonaispituus vaikuttaa formanttien sijaintiin, joten esimerkiksi nai- 
silla ja miehillä on usein hyvin erilaisia formanttiarvoja samoissakin 
vokaaleissa. Yleistyksiä voi kuitenkin tehdä koehenkilöryhmässä tur- 
vautumalla normalisaatioon eli käyttämällä formanttilukemia suhteutet- 
tuna puhujan omaan formanttiavaruuteen. Tilastollisessa analyysissa 
ääniväylien arvioidun pituuden voi ottaa huomioon, kunhan puhujilta 
on mittauksia tarpeeksi monesta vokaalista. 
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Formanttien taajuuksia voi arvioida visuaalisesti suoraan juoksevan 
puheen spektrogrammista tai esimerkiksi vokaalin keskiosasta lasketus- 
ta yksittäisestä spektristä (ks. jäljempänä kohta Akustisia mittauksia). 
Lisäksi on joukko laskennallisia rutiineja, jotka pyrkivät arvioimaan for- 
mantit automaattisesti. Ne voivat olla hyvin täsmällisiä mutta tyypillisesti 
vaativat puhujakohtaista säätelyä. Tutkijan täytyy joka tapauksessa rajata 
puhesignaalia, jotta mittaus kohdistuisi juuri mitattavaan vokaaliin. 

Usein tutkija antaa puhujalle joukon sanoja tai lauseita äännettäväksi, 
joten kontrolloituna muuttujana voi toimia mikä tahansa puheen ole- 
tettu rakenteellinen seikka: itse vokaalin identiteetti, vokaalin äänteelli- 
nen ympäristö, sanojen rakenne, prosodia jne. Tällöin on suotavaa, että 
äänitetään samoja tapauksia samaltakin puhujalta toistamiseen, jotta 
voidaan arvioida, kuinka paljon mittauksissa on satunnaista vaihtelua. 
Foneettisia ilmiöitä voi jossain määrin tutkia nykyään myös äänitetieto- 
kannoista, kuten Suomen kielen nauhoitearkistosta (ks. Haastattelu ai- 


neistonkeruun metodina sosiolingvistiikassa tässä kirjassa). 
Toinen mahdollisuus on käyttää verraten spontaania äänitettyä puhet- 


ta, jolloin ei ole varsinaisesti kontrolloituja muuttujia. Se tarkoittaa, että 
esimerkiksi vokaalin identiteettikin on tutkijan arvioitava itse, ympäris- 
töä ei voi kontrolloida eikä toistoja saada lainkaan. Silloin on tärkeää, 
että aineisto on suuri, jotta silti olisi mahdollista muodostaa luotettava 
kuva tutkittavasta ilmiöstä. 

Akustisia mittauksia. Kestot ovat akustisen mittauksen kohteista luul- 
tavasti yksinkertaisimpia mitata mutta eivät välttämättä yksinkertaisim- 
pia tulkita oikein. Ensinnäkin on muistettava, että puhe on fysikaalinen 
jatkumo, jonka saavat aikaan useiden rinnakkaisten ja toisiinsa nähden 
suhteellisen itsenäisten artikulaattorien liikkeet; puheessa on vain har- 
voja luontaisia katkoskohtia. Keston mittaus puolestaan kohdistuu jo- 
honkin segmenttiin — äänteeseen, tavuun, sanaan, lausumaan tms. Ha- 
vaintojatkumo on siis ensin jollakin tavoin segmentoitava. Toisekseen 
kestoja mitataan yleensä tavallisina ajan yksiköinä, esimerkiksi milli- tai 
senttisekunteina, mutta tutkijan on otettava huomioon, että kielenpuhu- 
jan kannalta puheen kestot eivät suoraan kytkeydy tähän ”fysikaaliseen” 
aikaan. Akustisten segmenttien havaittu kesto on tyypillisesti suhteessa 
ympäröivien elementtien kestoihin kompleksisin tavoin. Kestot ovat silti 
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varsin suosiollinen tutkittava ilmiö, koska ne säilyvät havaintokelpoisina 
usein hyvinkin huonolaatuisessa signaalissa. 

Ajallisella ulottuvuudella on myös toinen puoli, nopeus eli tempo. 
Usein ajallinen kesto niillä segmenteillä, joiden ominaiskesto on lyhyt, 
ymmärretään helpommin 'kestoksi', kun taas ominaiskestoltaan pitkien 
segmenttien kesto tulkitaan 'nopeudekst”. Periaatteessa voitaisiin lyhyttä 
vokaalia yhtä hyvin kutsua nopeaksi vokaaliksi ja pitkää vastaavasti hi- 
taaksi. Yleisemmin temposta kuitenkin puhutaan vasta, kun havainto- 
yksikkönä on vähintään tavun mittainen segmentti. 

Äänenkorkeus on toinen piirre, joka säilyy signaalissa varsin hyvin. 
Tämä johtuu siitä, että äänenkorkeus kertautuu puhesignaalin muina- 
kin piirteinä. Lähtökohtaisesti äänenkorkeuden aiheuttaa äänihuulissa 
syntyvä jaksollinen sointiääni, minkä vuoksi äänenkorkeus ilmenee vain 
puheen soinnillisissa jaksoissa. Soinnittomat konsonantit tai muu soin- 
nittomuus, esimerkiksi kuiskaus, katkaisevat äänenkorkeuskäyrän, ja 
katkoksen jälkeen äänenkorkeus usein hetkellisesti muuttuu nopeasti. 
Käytännössä tästä seuraa, että havaintovaikutelmaa vastaavan katkotto- 
man ja pehmeästi muuttuvan äänenkorkeuskäyrän aikaansaaminen ei 
mittauslaitteistoilla ole aivan yksinkertaista eikä kaikilta osin lainkaan 
mahdollista manipuloimatta käyrää käsin, paitsi jos varmistaa katkot- 
tomuuden etukäteen käyttämällä informanteilla äänitettävänä testi- 
lauseena Laina lainaa lainalle lainan -tyyppistä, yksinomaan soinnilli- 
sista äänteistä koostuvaa tekstiä. 

Edelleen on huomattava, että äänenkorkeudessa on kyse taajuudesta 
eli frekvenssistä, mikä tarkoittaa jonkin tapahtumista niin ja niin monta 
kertaa jossakin ajallisessa yksikössä. Äänenkorkeus on näin sidoksissa 
aikaan. Yksinkertaisimmillaan tästä seuraa, että jos tarkasteltava ajan- 
jakso on esimerkiksi 0,001 s (1 ms) ja tarkastelun kohteena 100 Hz:n 
äänenkorkeus (matalahko miesääni), havaintoikkunaan ei välttämättä 
mahdu yhtään tapahtumaa: 100 Hz:n taajuus tarkoittaa, että jotakin ta- 
pahtuu — äänihuulet avautuvat ja sulkeutuvat — sata kertaa sekunnissa 
eli yksittäinen jakso kestää 0,01 s (ro ms). Havaintoikkunan kohdalla ei 
välttämättä näy mitään. 

Äänenkorkeuskäyrän ohella voi seurata intensiteettikäyrää. Vaik- 
ka intensiteetti on yksi-yksisessä vastaavuussuhteessa havaittuun 
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äänenvoimakkuuteen, intensiteetin hetkittäisiä eli mikromuutoksia seu- 
rataan usein pikemmin muista syistä, esimerkiksi tutkimusvaiheessa 
segmentoinnin helpottamiseksi. 

Toinen yleinen akustisten mittausten kohde on puheen spektri eli 
puheen taajuusominaisuudet. Ne ovat huomattavasti kestoja herkempiä 
äänitteen laadulle ja käsittelylle. Esimerkiksi äänen pakkausalgoritmit 
(kuten MP3) suunnitellaan yleensä niin, että ne säilyttävät mahdolli- 
simman hyvin nimenomaan musiikin melodian ja havaintovaikutelman 
samalla, kun ne poistavat äänestä niin paljon tietoa kuin suinkin paka- 
takseen sen mahdollisimman pieneen tilaan. Puheentutkijan kannalta 
pakkausaleoritmit voivat poistaa oleellista tutkimustietoa. 


eläisivät onnellisina 
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Kuvio 3. Esimerkki ääniaaltokäyrästä ja sen litteraatista. 
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ihmiset | eläisivät onnellisina 
| 
| 


1i mi set e leo si vet ?on nel | lt si nõ 


Kuvio 4. Esimerkki spektrogrammista ja sen litteraatista. Puhenäyte on sama 
kuin kuviossa 3. 


Ääniaaltokäyrä on usein ensimmäiseksi käytetty väline puheääntä seg- 
mentoitaessa eli jaettaessa havainto- tai analyysiyksikköjä vastaaviin osiin 
(kuvioiden 3 ja 4 litteraattien kolme eri tasoa). Ääniaallolla on kaksi ulottu- 
vuutta, x-akselilla aika ja y-akselilla äänen ilmanpaineen vaihteluja vastaava 
amplitudi, jonka voi mieltää ehkä helpoimmin ilmamolekyylin siirtymäksi 
lepotilastaan eli o-tasolta. Segmentoinnin lisäksi ääniaaltokäyrä takaa siis 
jo mahdollisuuden ajan ja amplitudin mittaamiseen. Puheentutkimuk- 
selle tyypilliset kestomittaukset (äänteiden kesto, tavujen kesto, kestojen 
muutos ympäristön seurauksena jne.) on mahdollista tehdä ja usein teh- 
däänkin jo tässä näkymässä, muita näkymiä mahdollisesti vain segmen- 
tointiapuna käyttäen. Samoin on mahdollista mitata soinnillisen äänen 
taajuus yksinkertaisesti ääniaallon keston käänteislukuna (f= 1/t); soin- 
nittoman äänen sijoittuminen eri taajuuksille vaatii jo spektrin laskemista. 
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Aina keksimisestään asti yksi keskeinen foneetikon työkalu on ollut 
edellä mainittu spektrogrammi (ks. kuvio 4).? Spektrogrammi yhdistää sa- 
maan analyysiin spektrin ja aikaulottuvuuden. Sitä voi pitää sarjana tietyin 
aikavälein otettuja äänen spektrejä, jotka nähdään ajallisesti x-akselille 
järjestettyinä, ”ylhäältä päin” esitettyinä korkeuskäyrinä siten, että taa- 
juusasteikko esitetään y-akselilla ja kunkin taajuuden amplitudi näkyy 
tummuutena (tai eri väreissä, käytetystä välineestä riippuen). Spektro- 
grammin ehdottomana hyvänä puolena on ollut nimenomaan näiden kol- 
men asian — ajan, taajuuden ja amplitudin — saaminen ymmärrettävästi 
ja selkeästi samaan kuvaan. Ääniaaltokäyrän ohella spektrogrammi onkin 
jo vuosikymmeniä ollut äänen akustisen tarkastelun perusväline. Käytän- 
nön artikulatorisessa työskentely-ympäristössä, kuten Praatin analyysi- 
ikkunassa, nämä kaksi esitystapaa yleensä tukevat toisiaan. 

Myös spektrogrammi voi olla yksi segmentoinnin apuvälineistä, mut- 
ta sen varsinaisena vahvuutena on mahdollisuus tarkastella spektrin 
muutosta suhteessa aikaan. Puheentutkimuksessa yksi yleisesti käytetty 
äänen spektraalinen ominaisuus ovat jo mainitut formantit, jotka vastaa- 
vat muuttuvan ääniväylän kulloisiakin resonansseja eli ovat tulosta ääni- 
väylän kurkunpää-äänelle aiheuttamasta suodatusfunktiosta. Ne näkyvät 
spektrogrammissa leveinä tummina vaakasuuntaisina vöinä tai raitoina, 
ja ne on tapana numeroida alhaalta ylöspäin ykkösestä alkaen: F1, F2, F3 
jne. Esimerkiksi vokaaliavaruus on hyvin hahmotettavissa jo kolmen (tai 
jopa kahden) alimman formantin avulla, sillä kullakin vokaalilla nämä 
resonanssit sijaitsevat eri kohdissa. Sama informaatio löytyy periaattees- 
sa myös spektrikuvasta, joka on ajallisesti lyhyempi, mutta käytännössä 
hetkittäisen vaihtelun poissulkemiseksi on usein helpompi käyttää ajal- 
lisesti laajempaa spektrogramminäkymää. 

Spektrogrammeja on useanlaisia sille asetetuista parametreista riip- 
puen. Parametreja ovat aikaikkunan pituus, analyysissa käytettävä aika- 
ja taajuusaskel sekä aikaikkunan muoto. Aikaikkuna tarkoittaa tässä sen 
äänikatkelman kestoa, josta spektri lasketaan; koska aika ja taajuus ovat 
erottamattomassa suhteessa toisiinsa (jo esillä olleen kaavan f= 1/t mu- 
kaisesti), niitä ei käytännössä koskaan täysin voi erottaa toisistaan. Mitä 
tarkempi analyysi on ajan kannalta, sitä epätarkempi se on taajuuden 
kannalta ja toisin päin. Eri parametrein voi tutkia tarkemmin erilaisia 
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asioita. Kaksi perinteisesti käytettyä spektrogrammin muotoa ovat ku- 
viossa 4 esitetty ajan suhteen tarkempi leveäkaistaspektrogrammi (engl. 
wide-band spectrogram), joka sopii erityisesti formanttien mittaukseen, ja 
ajan suhteen epätarkempi kapeakaistaspektrogrammi (engl. narrow-band 
spectrogram), jota voi käyttää esimerkiksi äänenkorkeuskäyrän (Fo-käyrän 
eli kurkunpää-äänen perusvärähtelyn taajuuden?) analysointiin. 


Akustisia manipulointimahdollisuuksia ovat muun muassa: 


e (Uudelleen)syntetisointi. Käytetään todellista puhetta joko mallina 
tai lähteenä syntetisoidulle näytteelle, jolla tutkimusta varsinaisesti 
tehdään. Syntetisointi on erinomainen keino tutkia piirteitä, joita ei 
joko kohdata luonnollisessa puheessa lainkaan tai joiden tuotattami- 
nen todellisilla puhujilla aiheuttaa ei-toivottuja seurannaisilmiöitä 
jossakin muualla. Esimerkkinä voisi olla äännekestojen tutkiminen. 
Syntetisoidussa puheessa on mahdollista tuottaa portaattomasti eri- 
laisia äännekestoja, kun taas puhuja yleensä hallitsee luontevasti 
vain ne kestoasteet, jotka hänen puhumaansa kieleen kuuluvat. 

e Kohinan lisäys, suodatukset. Muuttamalla äänisignaalia eri tavoin 
voidaan helpommin tutkia, mihin kuulijan havainto kohdistuu 
ja millä tavoin. Esimerkiksi ns. kaistanpäästösuodatuksen avul- 
la, jossa äänestä pääsee läpi vain jokin taajuusalue (esim. 300- 
3 000 Hz), voidaan todeta, että kuulija havaitsee puheen perus- 
sävelen silloinkin, kun sen taajuus ei edes sijaitse suodatuksesta 
läpi päässeellä alueella. 


3.3. Perseptuaalinen tutkimus 


Puheen havaitseminen ja vastaanottaminen on kielenpuhujalle yhtä 
luonnollista, ellei jopa luonnollisempaa, kuin sen tuottaminen: jokai- 
nenhan on ensin kuulija ja vasta sitten puhuja. Toisin kuin puheen tuot- 
tamisessa helposti ulkoisen tarkastelun kohteeksi alistuvaa elimistöä ei 
ole. Tieteellisesti uskottavaan havainnon eli perseption tutkimukseen 
tarvitaan vähintäänkin muita tutkittavia kuin tutkija itse. Havaintokokein 
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yritetään tavoittaa se, miten havainto syntyy ja mitkä tekijät siihen vai- 
kuttavat, mitä voi olla mahdotonta tehdä pelkästään havainnoimalla ta- 
vallisia oikeita vastaanottotilanteita. Puheen havaitsemisen näkökulmaa 
on kutsuttu niin perseptuaaliseksi kuin auditiiviseksi fonetiikaksi. 

Korvan tiedetään vastaanottavan äänisignaalin ja muuntavan sen toisen- 
laiseksi signaaliksi, mutta millään laitteitta tapahtuvalla tarkastelutavalla ei 
voi tarkkailla sitä, miten tämä tapahtuu. Käytännössä havaitsemista tutki- 
taankin usein havaintokokein eli yrittämällä selvittää muita kielenpuhujia 
tarkkaillen, mitä he havaitsevat ja mitkä seikat havaintoon voivat vaikuttaa. 

Tyypillisen havaintokokeen rakenne. Tyypillisessä havaintokokees- 
sa koehenkilöille soitetaan ärsykkeitä, minkä jälkeen he saavat kertoa, 
miltä kukin ärsyke kuulostaa. Yksinkertaisessa havaintokokeessa är- 
sykkeinä käytetään luonnollista, oikeiden puhujien ääntämää puhetta, 
esimerkiksi yksittäisiä sanoja, ja kuulijan tehtävänä on kertoa, minkä 
sanan hän kuulee. Näin voidaan selvittää, kuinka varmalla pohjalla jokin 
hypoteettinen oppositio tutkitussa kieliyhteisössä on. Tietenkin täytyy 
keksiä keino kertoa puhujille, mitä merkityksiä pyydetään tuottamaan, 
sekä vastaavasti keino kerätä kuulijoiden havaitsemat merkitykset. Jos 
kyseisellä kielimuodolla on yleisessä käytössä oleva kirjoitusjärjestelmä, 
joka johdonmukaisesti erottaa kyseiset merkitykset, tilanne on helppo. 
Mikäli oppositio on voimassa, siirrytään tyypillisesti jatkotutkimukseen, 
jossa aineistona toimivat käytetyt ärsykkeet, nyt puhujien ja kuulijoiden 
kategorisoinneilla täydennettynä, ja yritetään löytää akustisia piirteitä, 
jotka korreloivat merkityseron kanssa. Toinen yleinen havaintokokeen 
tyyppi on kahden kielen vertailu: toisen kielen puhujien tuotoksia voi 
soittaa toisen kielen kuulijoille, jolloin voi selvittää kielten välisiä eroja. 
Tällaisen kokeen tuloksena syntyy niin sanottu sekaannusmatriisi (engl. 
confusion matrix), jota voi analysoida erilaisilla tilastomenetelmillä. 

Usein havaintokokeen ärsykkeet muodostavat jatkumoa edustavan 
sarjan, jossa vain yksi akustinen piirre muuttuu pienin täsmällisin aske- 
lin. Kyseisen akustisen piirteen arvellaan liittyvän olennaisesti tutkitta- 
vaan oppositioon. Koe paljastaa, onko näin, kuinka merkittävä akustinen 
piirre on opposition kannalta ja paljonko esiintyy variaatiota kuulijoiden 
kesken. Ärsykesarjan tekoon voi käyttää täysin syntetisoitua puhetta, 
jossa on helppoa kontrolloida akustiset erot tarkasti. Toisaalta, koska on 
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erittäin työlästä tuottaa havaintokokeisiin tarpeeksi laadukasta täysin 
synteettistä puhetta, toinen hyvin usein käytetty tapa on rakentaa ärsyk- 
keet luonnollisesta (äänitetystä) puheesta siten, että yhtä ja samaa alku- 
peräistä äänitettä muokataan tarkasti muuttuvin askelin (ks. kuvio 5). 


[^ 
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[= 
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— 
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= 
o 
= 
E 
o 
= 
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atoxo 
atoxoro 


vowel duration 
Esimerkki havaintokokeen tulosten esittelystà 


(identifikaatiofunktio; piirretty Nooteboomin kuvion 
mukaan, Nooteboom 1975, Figure 2.5.) 


Kuvio 5. Esimerkki havaintokokeen tulosten esittelystà (identifikaatiofunktio, 
Nooteboom 1975). 


Yksi ärsykesarja voi auttaa selvittämään, missä kulkee perseptuaalinen 
kategoriaraja ja kuinka jyrkkä se on, mutta tämä tieto sellaisenaan ei 
välttämättä ole kovin kiinnostava, ellei vertailla tuloksia toisiin vastaa- 
viin kokeisiin. Esimerkiksi saattaa olla mahdollista rakentaa ärsykkeet 
siten, että sarjan ääripäät selvästi edustavat opposition kahta kategoriaa 
kahdessa vertailtavassa kielessä. Havaintokokeen toteuttaminen kum- 
mankin kielen kuulijoiden kanssa mahdollistaa kielten välisen vertailun. 

Hyvin yleinen havaintokokeen muunnelma on myös sellainen, jossa 
on kaksi tai monta rinnakkaista ärsykesarjaa. Ärsykkeet ovat identtiset 
kaikissa sarjoissa yhtä eroa lukuun ottamatta. Kyseinen akustinen ero 
ei ehkä sellaisenaan riitä erottamaan merkityksiä luotettavasti, mutta se 
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saattaa esimerkiksi hiukan siirtää kategorioiden rajaa, mikä osoittaisi sen 
olevan relevantti havaitsemisessa. Esimerkiksi koesanan laajempi kon- 
teksti (kehyslauseen jokin ominaisuus, kuten tempo) saattaa toimia näin. 

Havainnon mittaaminen. Helpoin ja yleisin tapa mitata havaitsemista on 
kysyä havaitsijalta, mitä hän on havainnut. Koehenkilön tehtävää, jossa tar- 
koitus on nimetä eli luokitella tarjottuja ärsykkeitä, kutsutaan identifikaatio- 
tehtäväksi. Joskus tällaisessa tehtävässä koehenkilö saa vapaasti luokitella 
kuulemansa, mutta usein valintamahdollisuuksia rajataan etukäteen esim. 
kahteen tai kolmeen, ja koehenkilön on pakko valita yksi annetuista vaihto- 
ehdoista jopa silloin, kun hänestä tuntuu, että valinta on täysin mielival- 
tainen. Tällainen pakkovalinta-asetelma saattaa olla teknisesti helpommin 
järjestettävissä ja sen tulokset saattavat olla helpommin tulkittavissa verrat- 
tuna tehtävään, jossa vastausvaihtoehtojen määrää ei ole rajattu. 

Usein halutaan myös selvittää, millaisia puheessa esiintyviä eroja 
kuulijat yleensä pystyvät kuulemaan. Ero, jota ihminen ei pysty kuule- 
maan, ei luonnollisesti kelpaa kielellisen viestinnän käyttöön. Tehtävää, 
jolla yritetään selvittää ihmisen erottelukyvyn rajoja, kutsutaan diskrimi- 
naatiotehtäväksi. Yksinkertaisimmassa tapauksessa koehenkilö kuulee 
aina kaksi ärsykettä ja responssina kertoo, olivatko ne identtisiä vai eri- 
laisia (kumpaakaan ei siis tarvitse luokitella), ja vaikka on kehitetty myös 
joukko hieman mutkikkaampia mutta luotettavampia koeasetelmia, 
tavoite on kaikissa sama. Frottelukykyyn vaikuttaa tietenkin ihmisen 
kuulomekanismi yleensä, mutta taustalla saattaa olla muitakin tekijöi- 
tä, kuten äidinkieli, ikä, tms. Myös erilaisilla aivosähkökäyrämittauksil- 
la (herätevaste) on mahdollista nykyisin selvittää, mitä ääniä ihminen 
pystyy erottamaan erilaisissa olosuhteissa ilman, että häneltä tarvitsisi 
pyytää mitään aktiivista responssia (ks. Psyko- ja neurolingvistiikka tk.). 


Samaa havainnon tarkkuutta ja luokittelua yritetään arvioida erilaisis- 
sa asetelmissa, joissa koehenkilön tehtävänä on toistaa tai matkia kuule- 
maansa. Ärsykkeinä voi toimia vaikkapa koehenkilölle tuntemattoman 
kielen ääntämyksiä tai muokattuja äidinkielisiä ääntämyksiä. Tällöin 
ehkä selviää, mitkä seikat jäävät vaille huomiota, mutta myös, miten 
oma kielikokemus vaikuttaa siihen, mitä hän kuulee. 

Havaitsemisen vaikeutta eri tilanteissa voidaan arvioida esim. mit- 
taamalla reaktioaikoja tehtävässä, jossa koehenkilö yrittää reagoida 
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ärsykkeisiin niin nopeasti kuin mahdollista. Myös silmänliikkeiden 
seuranta auttaa valaisemaan havaintoprosessin etenemistä tehtävässä, 
jossa havaittavat vaihtoehdot ovat koko ajan visuaalisesti läsnä (esim. eri 
sanoihin viittaavia kuvia). 

Havainnon manipulointimahdollisuuksia. Pohjustustehtävällä (engl. 
priming) voidaan tutkia ennakko-odotusten vaikutusta puheen havaitse- 
miseen. Siinä koehenkilö saa havaita identtisiä ärsykkeitä eri konteksti- 
ärsykkeiden jälkeen. Edeltävä kontekstiärsyke saattaa muuttaa koehen- 
kilön havaintoa varsinaisesta tutkittavasta ärsykkeestä. Havaitsemisen 
ajallista ulottuvuutta voi tutkia esimerkiksi porrastetulla kuuntelulla 
(engl. gating) eli esittämällä puheen siten, että kuulija kuulee pienin 
askelin enemmän ja enemmän signaalia (ks. Grosjean 1980; 1996). 
Dikoottinen kuuntelu puolestaan on menetelmä, jossa koehenkilöllä 
kuuntelutetaan ääniärsykkeitä kuulokkeiden kautta, jotta vasempaan 
ja oikeaan korvaan voidaan soittaa eriävää signaalia. Jos halutaan tutkia 
esim. tarkkavaisuuden vaikutusta, vasen ja oikea kanava voivat olla täy- 
sin eri puhetta. Toisinaan taas sama puhesignaali on jaettu niin, että va- 
sen ja oikea korva saavat eri osia samasta puheesta, jolloin ehkä selviää, 
tapahtuuko havaitseminen varhaisemmassa — ennen korvien signaalien 
yhdistämistä — vai myöhäisemmässä vaiheessa. 


3.4. Muita aspekteja 


Puhujien rytmi ja synkronointi. Pitkään on kiinnitetty huomiota siihen, 
että puheen avulla välitetään informaatiota. Viime aikoina on enenevässä 
määrin nostettu esiin puheen synkronoiva funktio. On selvä, että puhu- 
jan eri artikulaatioliikkeitä pitää tavalla tai toisella keskenään tahdistaa 
eli synkronoida eli kohdistaa toisiinsa ajallisesti. Myös viestinnän osallis- 
tujat tahdistuvat eli ikään kuin pääsevät samalle aaltopituudelle puheen 
avulla. Informaatio- ja synkronointifunktiot oikeastaan edellyttävät toi- 
siaan: yhteinen puherytmi luo yhteisiä odotuksia, jotka sitten mahdollis- 
tavat yhteisiä valintoja, mutta valinnat myös ylläpitävät puhujien yhteistä 
rytmiä. Puhujien synkronointikykyä on tutkittu kekseliäin menetelmin, 
esimerkiksi simultaaniluennalla, jossa koehenkilöt lukevat samaa tekstiä 
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yhdessä (Cummins 2009). Myös äänitettyjä keskusteluaineistoja voi 
analysoida ääntämisen rytmin ja puhujien synkronoinnin kannalta. Pit- 
kään vallinnut käsitys, että maailman kielet kuuluisivat rytmiltään vain 
kahteen luokkaan, ns. tavu- ja painoajoitteisiin kieliin, on osoittautunut 
virheelliseksi. Kielet kyllä eroavat rytmeiltään toisistaan, mutta puhe- 
rytmi on kompleksisempi ilmiö ja sen kirjo laajempi kuin aiemmin on 
ymmärretty. Sen lisäksi kunkin kielen sisällä yksilöstä toiseen ja tilan- 
teesta toiseen on paljon rytmivaihtelua, joskus jopa enemmän kuin kiel- 
ten välillä. Toistaiseksi tätä aspektia on tutkittu verraten vähän. 

Sosiofonetiikka. Sosiofonetiikka on ollut kasvava tutkimussuunta vii- 
me vuosikymmeninä (ks. esim. Celata & Calamai 2014). Ala voidaan 
määritellä joko sosiolingvistiikan ja fonetiikan sulautumaksi (Thomas 
2002, 189) tai foneettiseksi tutkimukseksi, jossa tavallista enemmän 
otetaan huomioon viestinnän sosiaalinen luonne. Nimitys vakiintui 
käyttöön 1970-luvun lopulla. Sosiofoneettisia tutkimuksia yhdistäväksi 
punaiseksi langaksi voi nähdä sen, miten ja miksi puhe sosiaalisesti 
vaihtelee ja miten kielenpuhujat tätä vaihtelua viestinnässään hyödyn- 
tävät (Foulkes, Scobbie & Watt 2010, 704). 


4. Yhteenveto 


Edellä on esitelty esimerkkejä kokonaisista tutkimusasetelmista sekä 
yleisemmin tutkimusasetelman osia, mahdollisuuksia tehdä havaintoja 
puheesta ja toisaalta mahdollisia keinoja tarkasti kontrolloida puheen 
piirteitä. Esillä on ollut nimenomaan kielitieteellinen fonetiikka, mut- 
ta monien eri tieteiden — jopa laajempien tieteenalojen, kuten huma- 
nististen ja luonnontieteiden — rajalla sijaitsevana tieteenä fonetiikkaa 
voisi tarkastella monella muullakin tapaa. Se ulottuu esimerkiksi niin 
insinööritieteisiin (tutkimuskohteinaan esimerkiksi puhesynteesi tai 
automaattinen puheen tunnistaminen) kuin lääketieteeseenkin (jolloin 
kohteena voivat olla esimerkiksi puheen häiriöt). Yhdistävänä tekijänä 
on inhimillinen puhe, mutta tutkimusotteita siihen on lukemattomia. 
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VIITTEET 


1 "[--]ei puhuminen [- -] ole puhe-elinten määräasentojen jyrkkää vaihtelua, hyppää- 
mistä toisen äänteen vaatimasta asemasta seuraavan vaatimaan, vaan [- -] pysähdyk- 
sittä jatkuvaa liikettä [--]” (Penttilä 1948, 7). 

2 Engl. score; esim. nk. artikulatorisen fonologian teoriassa. 

3 Observoitavat muuttujat on toisinaan nimetty riippuviksi tai selitettäviksi muuttujiksi, ja 
kontrolloidut muuttujat on toisinaan nimetty riippumattomiksi tai selittäviksi muuttujiksi. 

4 "Meaning [-—] is to be regarded as a complex of contextual relations, and phone- 
tics, grammar, lexicography and semantics each handles its own components of the 
complex in its appropriate context." (Firth 1957 [1935], 19). 

5 Laitteiston rakenteesta ja toiminnasta ks. https://www.youtube.com/watch?v=6ole- 
joZ17jo. 

6 Digitoija on analogi-digitaali- eli A-D-muunnin esimerkiksi tietokoneen äänikortissa. 


Tietokone käsittelee digitaalista dataa, mutta ääni akustisena ilmiönä on luonteeltaan 
analogista, joten se täytyy ensin muuntaa. 

7 Myös sonagrammi vanhan tuotenimen mukaan. 

8 Tarkalleen ottaen Fo ja havaittu äänenkorkeus ovat tietenkin eri asioita, joskin määrä- 
suhteessa toisiinsa. 
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Mikä? 


Lingvistinen etnografia on metodologia, joka pyrkii ymmärtämään toi- 
mintayhteisöjen sosiaalista toimintaa niiden sisältä käsin ja osallistu- 
jien lähtökohdista. Näitä lähtökohtia ei oleteta, vaan osa etnografiaa on 
niiden selvittäminen. Etnografi siis tunnustaa oman ulkopuolisuutensa 
ja tutkimukseen osallistujien asiantuntijuuden heitä itseään koskevissa 


asioissa. 

Katso myös: 

Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 
Luku 13 Kielten dokumentointi ja kieliopin kuvaus 

Luku 16 Antropologinen lingvistiikka 

Luku 21 Sosiolingvistiikka 


Luku 22 Keskustelunanalyysi ja vuorovaikutuslingvistiikka 
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1. Johdanto 


Kuvitellaan, että haluaisit tutkia kielen sosiaalisia ulottuvuuksia ja vuoro- 
vaikutusta yhteisöissä, joita et tunne entuudestaan. Kuitenkin niille ih- 
misille, joita haluaisit tutkia, vieras ympäristö olisi tuttuakin tutumpi: 
he ehkä asuvat siellä tai kohtaavat siellä joka päivä. Heidän kielensä ja 
se, miten he käyttävät sitä jäsentämään suhteitaan toisiinsa ja ympäris- 
töönsä, on heille jokapäiväistä, mutta sinä et tiedä siitä juuri mitään, 
vaikka kieltä osaisitkin. Millaisia mahdollisuuksia sinulla olisi vastata 
tutkimuskysymyksiisi? Millaisia metodeja tarvitsisit? 

Tässä artikkelissa esittelemme etnografisten metodien keinostoa ke- 
rätä ja hyödyntää sosiolingvististä aineistoa. Keskitymme ennen muuta 
sellaiseen etnografiseen tutkimukseen, jota viime aikoina on erityisesti 
Iso-Britanniassa kutsuttu lingvistiseksi etnografiaksi (ks. Rampton, Tustin, 
Maybin, Barwell, Creese & Lytra 2004) niissä sosiolingvistisissä lähes- 
tymistavoissa, jotka on nimetty esimerkiksi vuorovaikutussosiolingvistii- 
kaksi, globalisaation tai mobilisaation sosiolingvistiikaksi, moninaisuuden 
sosiolingvistiikaksi (engl. sociolinguistics of diversity), kriittiseksi sosiolingvis- 
tiikaksi tai soveltavaksi sosiolingvistiikaksi (ks. Blommaert 2010; Madsen, 
Karrebaek & Moller 2015; Heller, Pietikäinen & Pujolar 2018). Yhteis- 
tä näille lähestymistavoille on tarkastella kielellistä variaatiota vuoro- 
vaikutuksessa sekä sitä, mitä merkityksiä vuorovaikutukseen osallistujat 
(fyysisissä tai virtuaalisissa tiloissa) antavat laajemmille yhteiskunta- 
rakenteille, kuten koulutusjärjestelmälle tai maahanmuuttopolitiikalle. 

Tämän teoksen artikkeleista lähimpänä lingvistisen etnografian me- 
todeita ja teorioita ovat sosiolingvistiikkaa, antropologista lingvistiikkaa, 
keskustelunanalyysia ja vuorovaikutuksen tutkimusta sekä haastattelu- 
ja käsittelevät luvut. Lingvistisen etnografian keinoin tutkitaan usein 
juuri sosiolingvistisiä kysymyksiä, ja sillä on yhteisiä juuria variaation- 
tutkimuksen, lingvistisen antropologian ja etnometodologisen keskus- 
telunanalyysin kanssa. Näissä kaikissa kiinnitetään huomiota aineiston 
autenttisuuteen, eikä kokeellisia metodeja yleensä käytetä. Etnografisesti 
kerättyjä aineistoja tarkastellaan usein variaationtutkimuksen tai vuoro- 
vaikutustutkimuksen metodein, mutta etnografia ei kuitenkaan ole vain 
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aineistonkeruun metodi, vaan siihen sisältyy jatkuvasti myös analyysia 
ja tulkintaa (Blommaert & Jie 2010, 7-15). 

Suomessa lingvistisen etnografian keinoin on viime aikoina tarkas- 
teltu muun muassa kansainvälisissä työtehtävissä toimivien insinöörien 
kokemuksia englannin kielen käytöstä sekä heidän kielellistä repertuaa- 
riaan (Räisänen 2013), inkerinsuomalaisten vanhusten kielioloja (Mo- 
nonen 2013), autenttisuuden käsitteen rakentumista suomalaisessa hip 
hop -musiikissa (Westinen 2014), nuorten kielellisiä resursseja ja niiden 
käyttöä sosiaalisessa asemoinnissa monietnisissä helsinkiläiskouluissa 
(Lehtonen 2015), osallistumisen ja identifioitumisen tiloja kristittyjen 
nuorten elämäntapaurheilijoiden yhteisössä (Peuronen 2017), toisen 
sukupolven aikuisten maahanmuuttajien kieli-identiteettiä (Bäckman 
2017) sekä turvapaikanhakijoiden arkea ruotsinkielisellä Pohjanmaalla 
(Pöyhönen, Kokkonen & Tarnanen 2019). Virtuaalisen vuorovaikutuk- 
sen kasvaessa myös verkkoetnografiat ovat kehittyneet omaksi tutki- 
mussuuntauksekseen (ks. Androutsopoulos 2014). Ne tutkivat kielel- 
listen ja kulttuuristen innovaatioiden virtauksia verkkoympäristöissä. 
Esimerkkinä voidaan mainita Kytölän (2013) tutkimus suomalaisten 
jalkapalloaiheisten keskustelufoorumien vuorovaikutuksesta. Kaikille 
näille tutkimuksille yhteistä on, että ne tarkastelevat yhteisesti jaettujen 
ideologioiden ja sosiaalisten normien sekä yksilöiden käyttämien kielel- 
listen resurssien leikkauspistettä toimintayhteisöjen käytänteissä. 

Resurssi voi olla mikä tahansa kieleen tai muuhun sosiaaliseen 
merkkijärjestelmään liittyvä valinta, jonka avulla luodaan merkitystä 
vuorovaikutustilanteessa. Taustalla on ajatus kielestä osana sosiaalis- 
ta semioosia. Visakon (2015, 22) mukaan semioosi on aikaan sidottu 
kudelma prosesseja, joissa merkkien tulkitaan merkitsevän jotakin ja 


+979 n. 


näin tuotetaan esimerkiksi ”merkitystä”, "tietoa" ja myös ”persoonia”.’ 
Lingvistiset etnografiat taas kuvaavat niitä sosiaalisia mekanismeja, joilla 
semioottisia resursseja, mukaan lukien kielellisiä resursseja, omaksu- 
taan, kierrätetään, nimetään ja tulkitaan uudelleen. 

Toimintayhteisön käsite on hyödyllinen lähtökohta. Käsite tarjoaa 
jokapäiväisemmän ja helpommin operationalisoitavan vaihtoehdon 
abstraktille puheyhteisön käsitteelle (Lave & Wenger 1991; Eckert & 


McConnell-Ginet 1992; Wenger 1998; Meyerhoff 2002; Barton & 


LUKU 5 LINGVISTINEN ETNOGRAFIA TOIMINTAYHTEISÖISSÄ 347 


Tusting 2005). Siinä missä puheyhteisö on abstrakti ja kuviteltu 
(Anderson 1983), toimintayhteisöllä tarkoitetaan sellaisia yhteisöjä, joihin 
samat ihmiset kokoontuvat jonkin yhteisen asian ja yhteisen toiminnan 
äärelle. Toimintayhteisö voi olla esimerkiksi koulu, harrastuspiiri, työ- 
paikka, kunnanhallitus, vastaanottokeskus tai periaatteessa mikä tahan- 
sa enemmän tai vähemmän yhteisten tavoitteiden ja sääntöjen mukaan 
toimiva ryhmä. Toimintayhteisöissä syntyy niiden omia käytänteitä ja 
normeja, toiminnan tapoja, ja kieli ja sen merkitykset elävät ja muuttu- 
vat näissä käytänteissä ja toiminnoissa. 

Vaikka tutkittava toimintayhteisö olisi suomalainen koulu ja etno- 
grafi olisi itse aiemmin käynyt suomalaisen koulun, hän ei voi olettaa 
läheskään kaikkia eri ajan ja paikan käytänteitä tutuiksi. Artikkelin 
alussa oletimme yhteisön, jossa etnografi ei ole koskaan ennen käy- 
nyt, mutta tämä ei tarkoita, että olisi lähdettävä tuhansien kilometrien 
päähän täysin toisenlaiseen kieli- ja kulttuuriympäristöön (ks. Kielten 
dokumentointi ja kieliopin kuvaus tässä kirjassa). Lingvistisen etno- 
grafian tutkimuskohteet voivat olla hyvinkin lähellä, ja yhä useammin 


ne ovat yhteisöjä, joiden toimintaan tutkija osallistuu. Tutkimuksen 
tavoitteena on nähdä tuttuuden ja itsestäänselvyyden läpi ja purkaa 
luutuneita tai suorastaan myytinomaisia arkisia käsityksiä kielestä 
ja sosiaalisista identiteeteistä (ks. Copland & Creese 2015), vaikkapa 
siitä, millaisille ihmisille suomen kieli kuuluu ja millaista suomen 
kieli voi olla. Silloin kun etnografi toimii yhteisössä, joka on hänel- 
le omakohtaisesti tuttu tai jonka jäsen hän on, hän tasapainottelee 
jäsenyytensä ja osin ulkopuoliseksi tarkkailijaksi asettuvan tutkijan 
asemassa, mikä on tiedostettava analyysissa. Olipa kenttä alun perin 
tuttu tai vieras, etnografian tekeminen on joka tapauksessa aaltoliiket- 
tä, jossa välillä kokee osallisuutta ja järjestystä, välillä ulkopuolisuutta 
ja tietämättömyyttä. 

Etnografian metodologiaan sisältyvät ainakin sen tietoteoreettiset 
taustakäsitykset, erilaiset kenttätyön ja aineistonkeruun metodit ja peri- 
aatteet, aineiston käsittelyn ja analyysin tavat, keinot välittää tutkimus- 
tuloksia erilaisille yleisöille ja takaisin tutkimusyhteisöön sekä tutkijan- 
position kriittinen tarkastelu. Etnografia ei siis ole vain yksi(n) metodi, 
eikä ole vain yhtä tapaa tehdä etnografiaa. (ks. myös Diskurssianalyysi 
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tk.) Kaikilla etnografioilla on kuitenkin joitakin yhteisiä piirteitä, joista 
luomme yleiskuvan. 

Luvussa 2 esittelemme etnografian keskeisiä piirteitä ja sen kirjon 
kehittymistä sellaiseksi kuin se nykyisin on sekä erityisesti sen hyödyn- 
tämistä suomalaisessa sosiolingvistiikassa. Luku 3 käsittelee etnografin 
käytännön työtä aineistonkeruusta analyysiin ja tutkimuseettisiin valin- 
toihin. Luku 4 on yhteenveto. 


2. Tiheä kuvaus 
2.1. Etnografian keskeiset piirteet 
Vaikka etnografiassa ei voikaan määritellä yhtä ontologista, epistemo- 


logista tai metodologista taustaoletusta, se yhdistetään tavallisesti ym- 
märtävään tai tulkitsevaan lähestymistapaan (ks. Johdannon luku 2 tk.), 


jossa tutkimuksen tavoitteena on ymmärryksen lisääminen tutkittavasta 
ilmiöstä (Guba & Lincoln 1998; Atkinson & Hammersley 1998). Etno- 
grafian juuret ovat antropologiassa ja erityisesti tulkitsevassa, geertzi- 
läisessä kulttuuriantropologiassa (ks. esim. Ruohonen & Laitila 1994). 
Siinä pyritään kokonaisvaltaiseen tulkintaan, jossa kulttuurinsisäiset 
symbolit saavat merkityksen osana laajempaa kulttuurista kokonaisuut- 
ta, ei siitä irrallaan. Kulttuuri nähdään siis symbolisena systeeminä tai 
tekstinä, jonka merkityksiä luetaan, käännetään ja tulkitaan. Tulkitessaan 
tutkija kirjoittaa tiheän kuvauksen (engl. thick description, ks. Geertz 1973, 
6), tekstin, jossa hän kuvaa yhteisön toimintaa ja kontekstia niin, että se 
vastaa yhteisön jäsenten kokemuksia ja on ulkopuoliselle ymmärrettävä. 
Jos tutkimukseen osallistujat eivät tunnista etnografin tekstiä, jokin on 
mennyt pahasti pieleen. Tutkija ei ole tällöin toiminut riittävän pitkään 
vuorovaikutuksessa tutkimukseen osallistujien kanssa, ei ole kuunnellut, 
mitä osallistujilla on ollut kerrottavanaan, eikä ole osannut liittää tutki- 
maansa toimintaa kontekstiin. Tekstistä on tullut tyhjä kuvaus. 
Etnografista tutkimusta on Suomessa tehty usealla tieteenalal- 
la, ja esimerkiksi kasvatus- ja sosiaalitieteissä kouluetnografialla on 
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pitka traditio (Lappalainen, Hynninen, Kankkunen, Lahelma & Tolonen 
2007; Gordon, Hynninen, Lahelma, Metso, Palmu & Tolonen 2007). 
Etnografian monitieteisyyden ja monimenetelmäisyyden vuoksi sitä on 


hankalaa määritellä tiiviisti (ks. myös Diskurssianalyysi tk.). Etnografia 
yhdistetään tavallisesti laadulliseen tutkimukseen, mutta tutkija voi hyö- 
dyntää myös määrällisiä menetelmiä, kuten laajoja rekisteriaineistoja. 
Vaikka etnografiaa voi tehdä monella tavalla, suurimpaan osaan etno- 
grafioista liittyy näitä piirteitä: 


e (riittävän) pitkäaikainen läsnäolo kentällä 

e pyrkimys kokonaisvaltaiseen analyysiin ja niin sanottuun tiheään 
kuvaukseen 

e erilaisten aineistonmuotojen käyttö; aineiston triangulaatio 

e tutkijanposition reflektointi 

e tutkimustulosten monenlainen levittäminen 

e tutkittavan yhteisön voimaannuttaminen tai osallistaminen. 


2.2. Lingvistisen etnografian kehityskulkuja 


Sosiolingvistisen etnografian juuria voi jäljittää toisaalta yhteiskunta- 
tieteellisiin kaupunkietnografioihin (Deegan 2007), toisaalta lingvisti- 
sen antropologian kenttätyöperinteeseen ja puheen etnografiaan, jota 
alun perin käytettiin Pohjois-Amerikan alkuperäiskansojen kielten ku- 
vaukseen (Hymes & Gumperz 1972; Duranti 1997; ks. myös Antropo- 


loginen lingvistiikka, Kielten dokumentointi ja kieliopin kuvaus tk.). 
Lingvistisen etnografian kannalta keskeinen on Dell Hymesin perin- 


tö (ks. Rampton 2007). Hymesin varhaiset, nyt klassikoiksi muodos- 
tuneet kirjoitukset (1972a; 1972b; 1974) olivat alun perinkin reaktiota 
Chomskyn generatiiviseen kielioppiin ja chomskylaiseen käsitykseen 
universaalista kielikyvystä sekä ideaalista yksikielisestä natiivipuhujasta. 
Hymes huomautti, että kaikissa kieliyhteisöissä esiintyy variaatiota ja 
monikielisyyttä ja kaikkien kielelliset kompetenssit ovat toisistaan poik- 
keavia — ideaalia yksikielistä natiivipuhujaa on siis vaikea löytää (19724). 
Yksikielisyyden normin sekä yhtenäisen kielimuodon ja natiivipuhujan 
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käsitteiden kyseenalaistaminen ovat yhä lingvistisen etnografian kes- 
keisiä teemoja. 

Hymesin ja tämän kollegan, vuorovaikutussosiolingvistiikan pionee- 
rin John Gumperzin kehittämä puheen etnografia (myöhemmin myös 
viestinnän etnografia) pyrki saamaan kiinni nimenomaan kielen kon- 
tekstuaalisuudesta; siitä, että kielellinen merkitys on aina kiinni ajassa, 
paikassa ja tilanteisessa kontekstissa. Hymesin ja Gumperzin perintö 
näkyy uudemmassa lingvistisessä etnografiassa muun muassa siinä, 
että vuorovaikutusta kuvataan usein sellaisissa yhteisöissä, joissa osal- 
listujien kielelliset resurssit ovat jollain lailla epäsymmetrisiä ja vuoro- 
vaikutukseen liittyy jatkuvaa neuvottelua valtasuhteista. Monet ovat 
kuitenkin huomauttaneet uudemman lingvistisen etnografian eroavan 
lingvistisen antropologian perinteestä siten, että siinä missä lingvisti- 
sessä antropologiassa on lähdetty kauas ja vieraiden pariin, lingvistisen 
etnografian tutkimuskohteet ovat usein lähellä ja näennäisen tuttuja 
(Hammersley 2007, 689; Copland & Creese 2015, 13-14). 

Hymesilainen traditio ja variaationtutkimus kohtaavat niin sanotus- 
sa kolmannen aallon variaationtutkimuksessa (Eckert 2012; variaation- 
tutkimuksen kolmesta aallosta ks. myös Sosiolingvistiikka tk.), jossa 


ollaan kiinnostuneita kielenpiirteiden sosiaalisesta indeksisyydestä eli 
siitä, millaisten ideologisten ja sosiaalisten prosessien kautta merkkejä 
liitetään tietynlaisiin ihmisiin ja miten merkeillä jäsennetään ihmisten- 
välisiä suhteita. Siinä missä ensimmäisessä ja toisessa aallossa variaa- 
tiota tarkastellaan variaabelin ja variantin? käsitteiden avulla, kolmannen 
aallon tavoitteena on kuvata minkä tahansa kielenpiirteen sosiaalista 
merkitystä vuorovaikutuksessa. 

Resurssi-termi on yleistynyt vaihtoehtona variantin käsitteelle. Ouistin 
(2005, 204-205) mukaan kielellinen resurssi on paikallista ja sosiaa- 
lista merkitystä kantava ja luova kielellinen mahdollisuus, jota puhu- 
jat voivat aktiivisesti käyttää tietynlaisen persoonan luomiseen ja itsen 
asemointiin. Jorgensen ja Moller (2014) ovat käyttäneet myös termiä 
piirre (engl. feature) korostaakseen sitä, että kielen sosiaalisia ulottu- 
vuuksia aletaan selvittää etnografisesti merkittäväksi osoittautuvasta 
kielenilmiöstä lähtien eikä ennalta määritellystä variaabelista tai varie- 
teetista käsin (ks. myös Lehtonen 2015, 37-38; Westinen 2014, 129-130). 
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Yksinkertaistettuna tämä tarkoittaa sitä, että kun etnografi-lingvisti me- 
nee kentälle, hänellä ei ole mielessään tiettyä kielenpiirrettä (tai variaa- 
belia), jota hänen on tarkoitus tutkia, vaan hän saa vasta havainnoimalla 
selville, mitkä resurssit vuorovaikutuksessa osoittautuvat merkitykselli- 
siksi tutkittavan yhteisön sosiaaliselle järjestykselle. 
Variaationtutkimuksen kolmas aalto siis käsitteellistää variaatiota toi- 
sin kuin labovilaisen variaabelin käsitteen kautta. Samoin kyseenalaiste- 
taan kielimuoto tai lekti? tarkastelun lähtökohtana (ks. Ouist 2008). Kie- 
li nähdään ennemmin toimintana kuin oliona: tarkastelun kohteena on 
se, millaisia merkityksiä milläkin piirteellä tietyssä tilanteessa ja toimin- 
nassa herätetään (ks. Johdannon luku 3 tk). Piirteet liittyvät rekisterei- 


hin, jotka voivat olla ”kieliä” (kuten suomi, englanti, havaiji) mutta myös 
muunlaisia sosiaalisen tulkinnan ja historiallisten prosessien kautta 
hahmonsa saavia kokonaisuuksia (kuten hip hop -tyyli, opetuspuhe) 
(Agha 2007; Madsen, Karrebek & Moller 2015). Tutkimuksen kohteita 
ei siis lähtökohtaisesti oleteta jonkin aiemmin kuvatun kielimuodon 
osaksi, vaan tarkastellaan juuri niitä sosiaalisia prosesseja, joissa tul- 
kinnat kielenpiirteistä ja kielimuodoista tutkitussa yhteisössä syntyvät. 
Kolmas aalto tarkastelee siten yksilön, ryhmän, toimintayhteisön ja 
laajemman yhteiskunnallisen kontekstin suhdetta toisiinsa sekä niitä 
mekanismeja, joilla kielenpiirteen sosiaalinen merkitys syntyy, muok- 
kautuu, uusiutuu ja vahvistuu vuorovaikutuksessa. Tarkastelun metodo- 
logiana on lingvistinen etnografia toimintayhteisössä. Vaikka kaikilla 
laadullista sosiolingvistiikkaa tekevillä tutkijoilla ei ole taustaa variaa- 
tionanalyysissa, kolmannen aallon myötä niin labovilaisen koulutuksen 
saaneet tutkijat kuin myös muita teitä vuorovaikutussosiolingvistiikkaan 
saapuneet alkoivat esittää kysymyksiä, joihin vastaamisessa etnografinen 
lähestymistapa on keskeinen. Nuo kysymykset liittyvät juuri yksilön ja 
paikallisen yhteisön kielen variaation, sosiaalisen asemoinnin sekä laa- 
jemmin jaettujen kieli-ideologioiden yhteyksiin. Kolmen aallon metafora 
on harhaanjohtava siinä, että se saattaa synnyttää kronologisuuden vai- 
kutelman tai sellaisen käsityksen, että uusi aalto pyyhkisi vanhan pois. 
Näin ei kuitenkaan ole: aallot rakentuvat limittäin ja toistensa varaan. 
Tutkijan oman kielikäsityksen hahmottaminen on välttämätön- 
tä tutkimuksen kannalta. Fi voi kuvata mitään, jollei selvitä itselleen 
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kuvattavan kohteen perusolemusta ja niitä olettamuksia, joista kuvauk- 
sen aloittaa. Lingvistisessä etnografiassa kieleen liittyviä ontologisia ky- 
symyksiä sekä tutkijan positiota onkin pohdittu verrattain paljon (ks. 
Heller 2011; Madsen, Karrebæk & Moller 2015). Näitä voisi pitää myös 
sen tutkimuskohteina. Lingvistisen etnografian ja uudempien laadul- 
listen sosiolingvististen lähestymistapojen kielikäsitystä voi useimmi- 
ten luonnehtia holistiseksi, kontekstuaaliseksi, sosiokulttuuriseksi ja 
dialogiseksi. Viime aikoina esillä ovat olleet myös lingvistisen antropo- 
logian piirissä syntyneet sosiaalisen indeksisyyden ja rekisteriytymisen 
teoriat (Ochs 1992; Silverstein 2003; Agha 2007; Woolard 2008). Erit- 
telemme seuraavaksi lyhyesti näitä lähtökohtia ja käsitteitä. 

Holistisuus ja kontekstuaalisuus. Etnografi kuvaa kielen limittäisyyt- 
tä muun toiminnan kanssa. Etnografiassa pyritään kuvaukseen tutkit- 
tavan yhteisön merkeistä ja merkityksistä, joiden avulla rakennetaan 
ja ylläpidetään yhteisön sosiaalista järjestystä. Kielelliset merkit eivät 
toimi tässä yksin, vaan merkitystä on ainakin toiminnalla, eleillä, ruu- 
miillisuuteen ja ulkonäköön liittyvillä seikoilla ja kaikenlaisilla tyylilli- 
sillä ja elämäntapavalinnoilla. Tätä tarkoitetaan holistisuudella (vrt. Auer 
2007, 11-15; Coupland 2007, 29-30; Quist 2005; Atkinson, Delamont 
& Housley 2008; Eckert 2012; Rampton, Maybin & Roberts 2015). Kai- 
kenlaiset sosiaalisessa asemoinnissa hyödynnettäviä erontekoja tuottavat 
merkit ovat osa sosiaalista semioosia (ks. Visakko 2015, 22-23). Puheen 
kontekstualisointi taas on vuorovaikutussosiolingvistiikan keskeinen kä- 
site. Sillä tarkoitetaan sitä, miten kielelliset valinnat herättävät assosiaa- 
tioita johonkin sosiaalisen maailman ilmiöön ja näin luovat ja muok- 
kaavat sitä kontekstia, jossa juuri sanottua tulkitaan (ks. esim. Gumperz 
1982; 1992; Auer 1992). 

Sosiokulttuurisuus ja dialogisuus. Kielen sosiokulttuurisuus ja dia- 
logisuus tarkoittavat sitä, että kielen ymmärretään syntyvän, elävän ja 
muuttuvan sosiaalisessa vuorovaikutuksessa. Moni tutkija on nostanut 
periaatteekseen Silversteinin (1985, 220) ”kaikenkattavan lingvistisen 
tosiseikan" (engl. the total linguistic fact). Sen mukaan kieli saa jatkuvasti 
uusiutuvat merkityksensä tilanteisessa kontekstissa mutta ihmismieles- 
sä ja kuitenkin osana kulttuurisia ideologioita (Lehtonen 2015, 54; ks. 
myös Woolard 2008; Blommaert & Rampton 2011; Madsen, Karrebæk 
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& Moller 2015). Puhujat kierrättävät tarjolla olevia kielellisiä resursseja ja 
tulkitsevat ja kontekstualisoivat niitä aina uudelleen uusissa tilanteissa. 
Lingvistisessä etnografiassa tai niin sanotussa moninaisuuden sosioling- 
vistiikassa ei siis pyritä yksittäisten kielten strukturaaliseen kuvaukseen. 
Kuvauksen kohteena on se, miten ”kieli tapahtuu” puhujien välillä, ja kie- 
lellisten merkkien merkitykset ovat ikään kuin olemassa vain osana sitä 
toimintaa ja vuorovaikutuskontekstia, joissa niitä kulloinkin käytetään. 

Näissä lähestymistavoissa on problematisoitu myös eri kielten rajo- 
jen olemusta, kun aineistot selvästi osoittavat, että vuorovaikutuksessa 
vaivattomasti ylitetään eri kielten rakenteelliset rajat ja sosiaalisiakin 
tulkitaan uudelleen: vuorovaikutuksessa käydään eksplisiittistä ja imp- 
lisiittistä neuvottelua siitä, mihin ja kenelle tietyt resurssit ”kuuluvat”. 
Puhujat käyttävät samassakin keskustelussa ”paloja” eri kielistä (engl. 
bits of language, ks. Blommaert 2010), ja samassakin keskustelussa käy- 
tetyt resurssit assosioituvat erilaisiin rekistereihin, esimerkiksi eri kie- 
liin tai tyyleihin. Juuri lingvistisen etnografian piirissä onkin alettu etsiä 
vaihtoehtoisia tapoja käsitteellistää kielen moninaisuuteen ja limittäi- 
syyteen liittyviä ilmiöitä. Tällainen on esimerkiksi ajatus ihmisestä kie- 
leilijänä ja kielellisestä vuorovaikutuksesta kieleilynä (engl. languaging, 
ks. Jorgensen, Karrebæk, Madsen & Moller 2011; Madsen, Karrebæk & 
Møller 2015). Ajatus lähtee siitä, että ihminen ensisijaisesti kommunikoi 
niillä resursseilla, joita hänellä on käytössään ja jotka kussakin tilantees- 
sa ovat toimivia ja sopivia ja osallistujien normiodotuksiin mukautuvia. 
Kielellinen ja kulttuurinen identifikaatio ja resurssien järjestäytyminen 
eri kieliin tai muihin rekistereihin kuuluviksi on sekundääriä ja ideo- 
logisen ja sosiaalisen tulkintaprosessin tulos. Rekisterit ja rekisteriyty- 
minen ovat kuitenkin merkittävä osa tutkimuskohdetta sinänsä. Kielten 
sosiaalisilla rajoilla ja kielten nimeämisellä on merkitystä sosiaalisen 
asemoinnin kannalta, ja kielten rajoista käydyn neuvottelun tutkiminen 
on lingvistisen etnografian ydinaluetta. 

Sosiaalinen indeksisyys. Lingvistinen etnografi kerää aineistoa, jon- 
ka avulla voidaan tarkastella semioottisten merkkien, vuorovaikutuk- 
sen, yksilön, toimintayhteisön sekä laajempien ideologioiden suhdetta 
toisiinsa. Linkkien luomisessa auttavat sosiaalisen indeksisyyden käsite 
ja rekisteriytymisen teoria (Agha 2007; suomeksi ks. Lehtonen 2015). 
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Sosiaalisella indeksisyydellä tarkoitetaan sitä, että merkillä, esimerkiksi 
kielenpiirteellä, on mahdollisuus herättää tietynlaisiin ihmisiin, heidän 
ominaisuuksiinsa tai ihmisten välisiin suhteisiin liittyviä assosiaatioi- 
ta. Näin merkki toimii kontekstualisoinnin keinona, joka ohjaa myös 
merkin, puheen, toiminnan ja koko vuorovaikutustilanteen tulkintaa: 
kielellisen merkin kontekstuaalinen tulkinta sisältää käsityksen siitä, 
kuka puhuu, kenen äänellä ja missä asemassa. Lehtonen (2015; 2016) 
on tutkinut, miten tietyillä kielenpiirteillä luodaan puheeseen mielikuva 
ei-natiivista suomenpuhujasta. Tällaisilla mina ei suami puhu -lausah- 
duksilla tuodaan vuorovaikutukseen esimerkiksi jonkinlaisen stereo- 
tyyppisen maahanmuuttajan ääni, mutta Lehtonen osoittaa, että niillä 
voidaan indeksoida myös ominaisuuksia, jotka ideologisesti ja stereo- 
tyyppisesti yhdistetään maahanmuuttajiin tai ulkomaalaisiin, esimerkik- 
si kyvyttömyyttä osallistua vuorovaikutustilanteeseen tai reagoida siihen. 
Tätä sosiaalista indeksisyyttä puhujat voivat hyödyntää asemoidessaan 
itseään meneillään olevaan vuorovaikutustilanteeseen. 

Sosiaalinen indeksisyys syntyy rekisteriytymisen prosessissa. Re- 
kisteriytyminen on aikaan ja paikkaan sidottu refleksiivinen prosessi 
(Agha 2007, 15—83). Siinä merkki saa tulkintoja, jotka mahdollistavat 
sen käytön sosiaalisessa asemoinnissa ja puheen kontekstualisoinnissa. 
Uusia mahdollisia merkityksiä syntyy vanhojen varaan, lomaan ja rin- 
nalle. Rekisteriytyminen tapahtuu sosio-historiallisessa merkin käyttö- 
kertojen ketjussa, jossa merkkejä käytetään ja tulkitaan aina uudelleen. 
Esimerkki rekisteriytymisprosessin kuvauksesta on Vaattovaaran ja Ha- 
losen (2015) kuvaama niin sanotun stadilaisen ässän myytin synty: sen 
sosiaalinen merkitys on syntynyt vuosikymmenten aikana mielikuvista, 
jotka liittyvät tietyn helsinkiläisen tyttökoulun oppilaisiin, ensimmäisiin 
suomenkielisiin teatterinäytöksiin, iskelmätähtiin ja myöhemmin itä- 
helsinkiläiseen tyttöduoon, viimeisimpänä homoseksuaalien urbaaniin 
elämäntapaan. Vaikka kaikki nämä merkitykset eivät jokaisessa merkin 
käyttötilanteessa välttämättä aktivoidu, ne ovat potentiaalisesti läsnä 
merkin kulloisessakin tulkinnassa. Eckertin (2008) käsittein ne ovat 
osa merkin indeksistä kenttää. 

Lingvistisen etnografian ja kolmannen aallon variaationtutkimuksen 
metodologian kannalta keskeistä on, että rekisteriytymistä ei voi kuvata 
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vain kieliaineksen vaihtelua kuvaamalla, vaan on kuvattava myös kieli- 
aineksen refleksiivinen tulkintaprosessi, siis yksinkertaisesti sanottuna 
se, millaisia merkityksiä kielenpiirteisiin liitetään. Toisin sanoen rekis- 
teriytymiseen liittyy aina ideologinen tulkinta, joka syntyy vuorovaiku- 
tuksessa. Tähän tarvitaan niin sanottua metapragmaattista aineistoa, siis 
kieltä kommentoivaa kieltä tai toimintaa. Käytännössä voi tarkastella 
esimerkiksi jaksoja, joissa ihmiset puhuvat kielestä, tai sitä, millaista toi- 
mintaa herättää sellainen vuorovaikutusjakso, jossa kieli tavalla tai toi- 
sella nousee osallistujien huomion kohteeksi (ks. myös Lehtonen 2015, 
41-42). Se, miten ihmiset mieltävät kielen ja sosiaalisten suhteiden yh- 
teydet, ja se, miten ideologiat ohjaavat toimintaa ja siten vaikuttavat kie- 
lelliseen vaihteluun, ovat yhtä suuri osa kielen vaihtelun ja muutoksen 
mekanismia kuin vaihtelu sinänsä: jos kuvaa vain sitä, millaista vaihte- 
lua aineistossa on, on oikeastaan kuvannut vasta osan siitä toiminnasta, 
joka vaihtelua aiheuttaa. 


3. Kentälle ja kirjaan! 
3.1. Aineistonkeruun käytänteitä 


Etnografiselle tutkimusprosessille on tyypillistä teorian, tutkijan, tutki- 
mukseen osallistujien, aineistonkeruun ja analyysin vuorovaikutteisuus. 
Tämä ilmenee esimerkiksi siten, että tutkija tavallisesti rajaa teoreetti- 
sen viitekehyksen ja asettaa itselleen lopullisen tutkimustehtävän vasta 
perehdyttyään tutkimukseen osallistujien kontekstiin ja heidän näkö- 
kulmastaan merkityksellisiin kysymyksiin aineiston keruun ja analyysin 
edetessä. Olennaiset kysymykset muotoutuvat usein vasta kenttätyössä. 
Esimerkiksi Jussi Lehtonen ja Sari Pöyhönen (2019) lähtivät liikkeelle 
Toinen koti -projektin alussa siitä, miten pakolaistaustaiset taiteilijat ja 
Suomessa syntyneet taiteilijat muodostavat ilmaisuyhteisön. Projektin 
edetessä merkitykselliseksi tuli kysyä, miten taiteen poliittisuuteen lii- 
tetyistä merkityksistä ilmaisuyhteisössä neuvotellaan teatteriesitystä 
rakennettaessa. 
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Etnografista tutkimusta tehdään yhä useammin monipaikkaisesti ja 
tutkimusryhmässä. Tyypillisesti monipaikkaisella etnografialla (Marcus 
1995) tarkoitetaan saman ilmiön tutkimusta erilaisissa konteksteissa. 
Varsin usein tällaisessa tutkimuksessa on vertaileva näkökulma. Yhden- 
kin etnografian sisällä voi olla useita fyysisiä ja virtuaalisia tiloja, joissa 
tehdään tutkimusta. Esimerkiksi vastaanottokeskuksen etnografiassa 
(Pöyhönen, Kokkonen & Tarnanen 2019) tehtiin tutkimusta kahdek- 
sassa paikassa: aikuisten turvapaikanhakijoiden asunnoissa, vastaan- 
ottokeskuksen toimistossa ja suomen kielen opetustiloissa, Oravaisten 
kylänraitilla, suomenkielisessä koulussa, alaikäisten ryhmäkodissa, 
ruotsinkielisessä kansanopistossa ja sosiaalisessa mediassa. Nämä kaik- 
ki tilat yhdistyivät samaan tutkimukseen tutkittavan ilmiön ja toiminta- 
yhteisön jäsenten kautta. Tutkimuksen ydinryhmään kuului kolme 
tutkijaa, joista yksi keskittyi aikuisten turvapaikanhakijoiden arkeen, 
yksi alaikäisten lasten koulunkäyntiin ja yksi työntekijöiden ammatilli- 
suuteen. Riittävän pitkäkestoisen etnografian, yhteisen tutkimusaineis- 
ton ja kenttähavaintojen metakommentoinnin ja vinjettien (ks. Creese, 
Takhi & Blackledge 2016) eli tutkijoiden henkilökohtaisia kokemuksia 
purkavien kenttätekstien avulla tutkijaryhmä pystyi paremmin tavoit- 
tamaan kokonaiskuvaa tutkittavasta ilmiöstä. Tutkijoiden työnjako ja 
yhteistyö oli tärkeää myös vertaistuen ja työssä jaksamisen näkökulmas- 
ta, sillä tutkimusaihe ja avainhenkilöiden elämäntilanteet olivat varsin 
haastavia. 

Mistä etnografinen aineistonkeruu sitten alkaa? Tyypillisesti etno- 
grafisen aineistonkeruun oppaissa keskitytään kentällä oloon eli tutkijan 
toimintaan yhteisössä. Tämä on ymmärrettävää, sillä aineistonkeruu on 
keskeinen osa mitä tahansa empiiristä tutkimusta. Etnografisen tutki- 
musprosessin voi myös hahmottaa kolmeen vaiheeseen: ennen kenttää, 
kentällä ja kentän jälkeen. Vaiheet eivät ole selvärajaisia, mutta niissä on 
tiettyjä painotuksia, joista tutkijan on hyvä olla tietoinen. 

Etnografinen aineistonkeruu alkaa jo siinä vaiheessa, kun tutkija tu- 
tustuu toimintayhteisöön esimerkiksi kirjallisten dokumenttien kaut- 
ta. Samalla hän opettelee yhteisön (esim. koulu, työpaikka, sairaala, 
vastaanottokeskus) kielellisiä ja kulttuurisia toimintatapoja, jotka ovat 
tärkeitä tutkimusprosessin kannalta. Etnografiassa harvoin asetetaan 
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hypoteesia, jota pyrittäisiin todistamaan oikeaksi tai vääräksi. Mielessä 
voi ennen kentälle pääsyä olla aihe tai fokus, johon etnografi haluaa 
keskittyä, mutta useimmiten on tärkeää aluksi saada käsitys siitä, mikä 
yhteisön vuorovaikutuksessa on ylipäätään merkityksellistä. 

Ennen kentälle pääsyä tutkijan on myös selvitettävä toimintayhteisön 
portinvartijat: kenen kanssa tutkimuksesta on keskusteltava, jotta tut- 
kimus olisi ylipäätään mahdollista? Tässä vaiheessa on myös erityisen 
tärkeää, että tutkija ei pitäydy omassa tutkijankielessään vaan kykenee 
kertomaan portinvartijoille tutkimuksesta niin, että toimintayhteisössä 
herää kiinnostus ja luottamus tutkimusta ja tutkijaa kohtaan. On hyvä 
oppia ilmaisemaan, jos ei ymmärrä jotain ilmiötä tai käytännettä, sillä 
tämä avaa toimintayhteisön jäsenille mahdollisuuden tuoda esille oma 
asiantuntemuksensa — heidän elämästäänhän on kysymys. 

Portinvartijoiden kautta tutkijalla on mahdollisuus tutustua muihin 
yhteisön jäseniin. Tämä on tärkeä vaihe kaikessa etnografisessa tut- 
kimuksessa mutta erityisesti silloin, kun tutkimuksessa on tarkoitus 
osallistaa toimintayhteisön jäseniä analyysiin ja tutkimuksesta viestin- 
tään (Bradley, Moore, Simpson & Atkinson 2018). Vuorovaikutussuhde 
tutkijan ja tutkimuksen osallistujan välillä taas edellyttää halukkuutta 
vuorovaikutukseen molemmilta osapuolilta. Tilanteet, joissa tutkimuk- 
seen osallistujat valikoituvat, ovat osin tietoisia tutkijan valintoja, osin 
tutkimuksen edetessä tapahtuvia sattumia. Etnografiseen prosessiin 
mahtuu yllätyksellisyyttä. 

Triangulaatio on ikään kuin sisäänrakennettu etnografiaan (ks. Joh- 
dannon luku 4; Kielikontaktien tutkimus tk.). Triangulaatiolla tarkoite- 


taan sitä, että samaan havaintoon ja tulokseen voidaan päätyä erilaisten 
aineistojen kautta. Tällöin havainnot tukevat toisiaan ja lisäävät aineis- 
ton todistusvoimaa. Etnografialle ominaisia aineistonkeruun tapoja ovat 
(osallistuva) vuorovaikutustilanteiden havainnointi, keskustelut ja haas- 
tattelut osallistujien kanssa, spontaanin vuorovaikutuksen ääni- ja video- 
tallenteet sekä moninaiset dokumentit ja artefaktit, kuten valokuvat, 
piirrokset, koulutehtävät, asiakirjat ja sosiaalisen median tekstit. Ilman 
riittävän pitkäaikaista ja systemaattista havainnointia ei ole etnografiaa, 
ja pelkkä havainnointi ei ole etnografiaa. Esittelemme seuraavaksi ly- 
hyesti erilaisten aineistojen keräämiseen liittyviä kysymyksiä. 
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Tutkija kirjoittaa havainnoistaan muistiinpanoja ja kenttäpäiväkirjaa 
(ks. esim. Emerson, Fretz & Shaw 2007 [2001]). Kenttäpäiväkirjan ei 
tarvitse olla pelkkää tekstiä, vaan siihen voi yhdistää ääntä ja kuvaa. Näin 
muistiinpanot on helpompi yhdistää muihin aineistoihin, kun niihin on 
jo valmiiksi ankkuroitu tiettyjä hetkiä äänellisesti ja kuvallisesti. Eten- 
kin pitkäaikaisessa etnografiassa monimediainen kenttäpäiväkirja on 
hyödyllinen. Tutkija voi kirjoittaa myös erillistä tutkimuspäiväkirjaa, 
jossa hän yhdistää analyysinsa kentällä tehdyistä havainnoista muihin 
tutkimusaineistoihin ja tutkimuskirjallisuuteen. Jotkut etnografit me- 
nevät kentälle havainnointia tukevan kaavion, taulukon tai muistilistan 
kanssa, toiset taas tekevät muistiinpanoja spontaanimmin sellaisista 
episodeista, joihin kiinnittävät huomionsa. Aina ei muistiinpanoja teh- 
dessään osaa ennustaa, mikä on myöhemmän analyysin kannalta mer- 
kityksellistä. Siksi muistiinpanojen tekeminen on olennaista, ja siihen 
on hyvä kehittää itselle sopivia rutiineja. 

Havainnointi ja kenttäpäiväkirja ovat toimivia tapoja aloittaa aineis- 
tonkeruu. Haastatteluiden avulla voi tutustua ihmisiin, ja ne koetaan 
myös luontevaksi tutkijan toiminnaksi. Etnografinen haastattelu on 
omanlaisensa tutkimushaastattelun laji: siinä tutkijalla ja tutkittavilla 
on yleensä enemmän yhteistä maaperää kuin haastattelututkimukses- 
sa (ks. Sherman Heyl (2007 [2001]; ks. myös Haastattelu aineistonke- 


ruun metodina sosiolingvistiikassa tk.). Haastattelu limittyy muuhun 
kenttätyöhön. Toisaalla alkaneet keskustelut voivat jatkua haastattelus- 


sa, tai haastatteluihin voidaan palata myöhemmin kenttätyön aikana. 
Haastatellessaan tutkija kartuttaa ymmärrystä siitä, mikä toiminta- 
yhteisön jäsenille on merkityksellistä. Haastattelut toimivat siten sekä 
tutkimuksen osallistujalle että tutkijalle analyyttisena taukona, jossa 
pohditaan toimintayhteisön käytänteitä. Haastattelut ovat myös hyvä 
silta vuorovaikutustilanteiden ääni- ja videotallenteisiin, jotka ovat 
olennainen osa lingvististä etnografiaa. Etnografisessa tutkimuksessa 
voidaan käyttää myös määrällisiä aineistonkeruu ja -analyysimenetel- 
miä tutkimuksen kontekstualisoimisessa tai yhdistämisessä vuorovai- 
kutusanalyysiin. 
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Spontaanien vuorovaikutustilanteiden tallenteita on monenlaisia, ja nii- 
tä suunnitellessa on otettava huomioon ainakin seuraavia asioita: 


e Miten tallennustilanne esitellään tutkimuksen osallistujille? Miten 
he ilmaisevat suostumuksensa (esim. suullisesti, kirjallisesti)? 

e Millaista tekniikkaa tarvitaan: riittääkö tilanteessa yksi tallennus- 
laite vai tarvitaanko useampia? 

e Liikkuvatko ihmiset tilanteessa: ovatko tallennuslaitteet paikoillaan 
vai liikkuvatko ne ihmisten mukana? 

- Millä tavalla ja missä määrin tutkija on itse mukana tallennetuissa 
tilanteissa? 

e Kuinka tärkeää on tallentaa koko tilassa tapahtuva toiminta 
videolle? 

+ Käytännön järjestelyissä on aina ajateltava sitä, että tallennuksesta 
on saatava selvää ja se on pystyttävä litteroimaan edes karkeasti. 
Jos puhujia on paljon eivätkä he ole tuttuja litteroijalle, video on 
yleensä tarpeellinen. 

e Tutkimusympäristön institutionaalisuus vaikuttaa siihen, millaisia 
lupia tarvitaan. 

e Tutkimusluvat saattavat aiheuttaa päänvaivaa, jos toimitaan paikas- 
sa ja tilassa, jossa liikkuu myös muita kuin tutkimukseen osallis- 
tuvia ihmisiä: Miten heidät rajataan pois tallenteista? Miten heille 
kerrotaan tutkimuksesta? 

e Millainen tallennusformaatti on tutkimuksen kannalta käytännöl- 
lisin? Mitkä tiedostomuodot ovat yhteensopivia analyysivaiheessa 
käytettyjen ohjelmien kanssa? Miten ne tukevat monikielistä ja 
multimodaalista analyysia (eri kirjoitusjärjestelmät, kirjoitussuun- 
nat, liike, kuva)? 

- Miten aineisto säilytetään tietoturvallisesti? Miten se anonymisoi- 
daan ja millaiset luvat sen jatkokäyttöön on? Mikä aineisto hävite- 
tään ja mikä arkistoidaan? 


Erilaisia tallennusvaihtoehtoja voi havainnollistaa esimerkiksi Lehto- 
sen (2015) tutkimuksen avulla. Hän käytti luokkatilanteiden tallentami- 


seen videokameraa ja siihen ulkoista mikrofonia, joka asetettiin niiden 
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tutkittavien läheisyyteen, joiden vuorovaikutuksesta hän sillä hetkellä 
oli erityisen kiinnostunut. Lisäksi luokkatilassa saattoi samaan aikaan 
olla pari muuta nauhuria. Lehtonen antoi lisäksi tutkittavien kantaa 
mukanaan pientä äänitallenninta. Näin syntyi keskeinen osa tutkimuk- 
sen aineistosta. Tilanne, jossa tutkittavaa pyydetään päästämään tutkija 
— tallennuslaitteen kautta — lähelle, on hyvin herkkä. Tutkittavien on 
siinä vaiheessa jo jossain määrin luotettava tutkijaan. Vaikka tutkija ei 
olisi kaikissa tallennustilanteissa fyysisesti paikalla, hän on läsnä: hä- 
nelle saatetaan esimerkiksi puhua tallennuslaitteen välityksellä. Tämä 
ei missään nimessä tee aineistosta epäonnistunutta. Tutkijanposition 
jatkuva reflektointi on olennainen osa etnografiaa, ja kukin vuorovaiku- 
tustilanne on omalla tavallaan edustava. Juuri tallennustilanne saattaa 
suorastaan lisätä metapragmaattisen aineiston kannalta kiinnostavan 
ulottuvuuden, sillä se kannustaa tietynlaisiin kieltä kommentoiviin per- 
formansseihin. Tämä ilmenee myös esimerkiksi silloin, kun tutkimuk- 
seen osallistujaa pyydetään ottamaan valokuvia vuorovaikutuskäytänteis- 
tään ja ympäristöistään. Tutkimukseen osallistuja kokee tarpeelliseksi 
sanoittaa ottamiaan valokuvia ja siten perustella tilanteiden ja ympäris- 
töjen merkitystä elämässään. 

Etnografin aineisto on käytännössä rajaton: varsinkaan kenttätyön 
alkuvaiheissa ei välttämättä osaa arvioida, mitä kentältä kannattaa kerätä 
ja mitä ei tarvitsisikaan. Siksi etnografinen aineisto ja sen käsittely on 
jonkin verran erilaista kuin sellainen aineisto, jonka koko ja koostumus 
on ollut tiedossa jo keruun alkaessa (vrt. Korpusaineistot tk.). Aineistoa 
kertyy yleensä paljon, ja tallenteita esimerkiksi tuskin on mielekästä al- 


kaa litteroida alusta loppuun: tutkimuskysymysten tarkennuttua ja usei- 
den kuuntelukertojen jälkeen voi valita tarkempaan tarkkailuun ne epi- 
sodit, joiden tarkempi analyysi erityisesti vastaa tutkimuskysymyksiin. 
Valinnassa auttavat myös vinjetit (Creese, Takhi, & Blackledge 2016), 
joiden avulla tutkija erottaa olennaisen kohinasta. 
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3.2. Tutkijanpositio ja etiikka 


Etnografian eettisyys on merkittävä mutta vaikeasti arvioitava tekijä. Eet- 
tinen tavoite kaikessa tutkimuksessa on se, että se ei vahingoita tutki- 
mukseen osallistuvia. Etnografisessa tutkimuksessa yksityisyyden suoja 
ja tutkimukseen osallistuvan itsemääräämisoikeus ovat keskeisiä eettisiä 
näkökohtia. Kirjallinen tai suullinen tutkimukseen suostuminen ei vie- 
lä tee tutkimuksesta eettistä. Pitkäaikaisessa etnografisessa tutkimuk- 
sessa onkin olennaista, että tutkimuksesta puhutaan säännöllisesti, ja 
tutkimukseen osallistujalla on esimerkiksi mahdollisuus kieltää jonkin 
tilanteen ääni- tai kuvatallentaminen tai jonkin keskustelun päätyminen 
tutkimusaineistoksi edes muistiinpanojen muodossa. On myös tutkijan 
velvollisuus muistuttaa tutkimukseen osallistujia siitä, että tutkija on 
työssään. Näin on erityisesti laita silloin, kun tutkijan ja tutkimukseen 
osallistujan suhde kehittyy läheiseksi vuorovaikutussuhteeksi. Tämä on 
pitkäaikaisessa etnografiassa hyvin todennäköistä. 

Etnografisen tutkimusprosessin vuorovaikutteisuus ja syklisyys edel- 
lyttävät tutkijalta tietoisuutta omasta roolistaan. Tutkijan tulee aina ottaa 
huomioon, että tutkimukseen osallistujat ovat omaa toimintaansa ana- 
lysoivia subjekteja, jotka voivat kriittisesti arvioida tutkijan etnografista 
kirjoitusta ja hänen eettisiä ja poliittisia näkemyksiään. Tutkijan on hyvä 
pyrkiä läheiseen vuorovaikutukseen tutkimukseen osallistuvien kanssa 
ja samaistumaan yhteisön jäsenten kokemusmaailmaan - niissä rajois- 
sa kuin se on mahdollista. Tutkijalla voi olla myös toimintaa muuttava 
rooli, jolloin ilmiön ymmärryksestä saattaa nousta kriittinen ja kantaa 
ottava tulkinta. Tästäkin positiosta tutkija neuvottelee toimintayhteisön 
jäsenten kanssa tutkimuksen aikana. 

Tutkijan rooliin liittyy myös ristiriitoja. Esimerkiksi kouluetnografias- 
sa tutkijalle saatetaan kentällä sovittaa stereotyyppistä arvioijan pukua, 
jossa tutkijan oletetaan arvioivan koulun toimintatapoja etsiäkseen niis- 
tä puutteita tai heikkouksia (ks. esim. Pöyhönen 2004). Tämä vaikeut- 
taa olennaisesti tutkijan mahdollisuuksia ymmärtää koulun toimintaa 
sisältäpäin ja jopa estää koko tutkimuksen toteutumisen. Oppilaiden 
arkea koulussa tutkiva aikuinen luovii myös oppilaiden luottamuksen 
ja aikuisen auktoriteetin välillä: hänellä on aikuisena ja ulkopuolisena 
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oletusarvoisesti sellaisia oikeuksia, joita oppilailla ei ole, eivätkä säännöt 
ja velvollisuudet koske häntä niin kuin oppilaita. Tämä tekee tutkijasta 
oppilaiden silmissä helposti opettajien kumppanin. (Ks. Lehtonen 2015.) 
Tutkijan on siis tunnistettava ja tehtävä selväksi oman toimintansa am- 
matilliset rajat. Vastaanottokeskuksen etnografiassa (Pöyhönen, Kokko- 
nen & Tarnanen 2019) tutkimusryhmä teki kovasti työtä, jotta tutkijoita 
ei pidettäisi maahanmuuttoviraston tai poliisin edustajina. Turvapaikan- 
hakijat olivat oppineet olemaan luottamatta viranomaiseen, ja tutkija 
asemoitui viranomaiseksi heidän lähtömaissaan. Tätä luottamusta piti 
rakentaa koko tutkimusprosessin ajan. 

Tutkija joutuu kenttätyön kuluessa usein miettimään, miksi tutkit- 
tavat suostuisivat hänen pyyntöihinsä; mitä he tutkimuksesta ”saavat”. 
Ideaali tilanne on tietenkin sellainen, että tutkimukseen osallistuvat 
kokevat pystyvänsä vaikuttamaan heitä koskeviin ja heille tärkeisiin 
asioihin ja haluavat siksi osallistua tutkimukseen. Kun toimitaan las- 
ten tai nuorten kanssa, hyvin abstrakteja perusteluja voi olla turha an- 
taa. Heistäkin kuitenkin yleensä on hauskaa saada katsoa tai kuunnella 
omia tallenteitaan (jos tutkija lupaa tämän, lupaus on pidettävä!). Joskus 
tutkijat ovat korvanneet tutkittavien heille antamaa aikaa esimerkiksi 
tarjoamalla kahvit, ruoan tai vaikkapa elokuvalippuja. Osallistuminen 
pelkän palkkion vuoksi on kuitenkin eettisesti ongelmallista. Tutkijan 
on pohdittava myös omia voimavarojaan, jos tutkimukseen osallistuja 
ajattelee saavansa tutkijasta elinikäisen ystävän. Etenkin pitkäaikaisessa 
etnografisessa tutkimuksessa on hyvä hiljalleen valmistautua tutkimuk- 
sen päättymiseen — niin tutkijan kuin tutkimukseen osallistujienkin. 

Etnografinen tutkimus ei pääty raportointiin, vaan tutkijan tulee ottaa 
myös huomioon, millainen ilmapiiri yhteisöön jää tutkimuksen jälkeen 
ja miten tutkimus mahdollisesti muuttaa yhteisön toimintaa. Tutkijan 
on myös huolehdittava siitä, että hän ei omalla toiminnallaan estä tois- 
ten tutkijoiden pääsyä kentälle. Tässä mielessä tutkijan eettinen vastuu 
tutkimukseen osallistujien hyvinvoinnista jatkuu vielä kentällä olon ja 
raportoinnin jälkeen. 
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3.3. Millaista tietoa etnografia tuottaa? 


Etnografia on olemukseltaan syvästi laadullista. Se ei pyri vastaamaan 
sellaisiin kysymyksiin, joihin vastataan tilastollisella merkitsevyydellä. 
Sen sijaan etnografia voi valaista ilmiöitä tilastojen takana: se lisää ym- 
märrystä siitä, mikä kaikki arjessa on merkittävää. Tilastollisesti voidaan 
esimerkiksi havaita eroja siinä, miten erilaiset oppilaat menestyvät kou- 
lussa ja sijoittuvat jatko-opintoihin. Tilastotieteellinen analyysi kuitenkin 
harvoin tarjoaa vastauksia siihen, mitä ovat ne arjen toiminnot, joihin 
osa oppilaista pystyy osallistumaan toisia paremmin. Etnografiassa on 
ripaus löytöretkeilyä: etnografisin metodein on mahdollista ymmärtää 
jonkin sellaisen arkisen seikan merkityksellisyys, joka on silmiemme 
edessä mutta jota emme tule ajatelleeksi. Indiana Jonesin saappaisiin 
tutkijan ei silti pidä astua, vaan tutkimusta tehdään yhteistyössä, vaik- 
ka tutkijalla on tärkeä rooli ilmiön ymmärtämisessä ja kuvaamisessa 
tiedeyhteisölle. 

Yleistettävyys ja toistettavuus ovat klassisia tieteelliselle tutkimuk- 
selle asetettuja vaatimuksia. Näistä kumpikaan ei toteudu etnografias- 
sa aivan klassisimmalla tavalla: kun lähtökohta on se, että tilanteisesta 
ja paikallisesta kontekstista ei voi irrottaa tai jättää huomiotta mitään 
muuttamatta sitä, on tietysti mahdotonta ajatella, että jokin tutkimus 
toistettaisiin eri ajassa ja paikassa juuri samanlaisena. Tämä ei kuiten- 
kaan tarkoita, että etnografiassa tingittäisiin tieteellisyydestä tai että sen 
tuottama tieto ei olisi luotettavaa. Etnografiassa tieteellisyyden vaatimus 
liittyy ennen muuta läpinäkyvyyteen ja tutkijanposition tiedostamiseen: 
tutkijan on kuvattava, miten aineisto on syntynyt ja miten argumentti 
rakentuu, jotta muut voivat arvioida tuloksen relevanssia ja suhdetta 
omaan työhönsä. Etnografian yleistettävyys ja toistettavuus taas syntyy 
siitä, miten tutkija keskusteluttaa havaintojaan ja analyysiaan muun tut- 
kimustiedon kanssa. Etnografi kuvaa tendenssejä ja mekanismeja sekä 
paikallisten käytänteiden suhdetta yhteiskuntajärjestelmiin. Tutkimuk- 
sen kulun kuvauksen ja argumentoinnin on oltava niin läpinäkyvää, että 
toinen tutkija pystyy arvioimaan sen luotettavuutta. Suhteuttaminen voi 
olla myös monipaikkaista ja kansainvälistä. Esimerkki monipaikkaises- 
ta ja kansainvälisestä etnografiasta on tutkimus, jossa verrattiin, miten 
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eurooppalaisen viitekehyksen määritelmää tekstitaidoista on tulkittu 
Tanskassa ja Suomessa aikuisten maahanmuuttajien kotoutumiskoulu- 
tuksessa. (Holm & Pöyhönen 2012.) 

Hahmotellessaan lingvistiikan ja etnografian suhdetta Rampton (2006, 
394-395) korostaa, että lingvistiikka voi napakoittaa etnografiaa. Lingvis- 
tiikassa on vankka puheen tallentamisen, käsittelyn ja analysoinnin pe- 
rinne, joka etnografiseen tietoon yhdistettynä tarjoaa järeitä työkaluja. 
Sosiologisesti painottuneet etnografiat saattavat tiedostaa kielen keskei- 
syyden sosiaalisten merkitysten tuottamisessa, mutta ilman kielitieteel- 
listä käsitteistöä kieltä on vaikea eritellä analyyttisesti. (Sosio)lingvistinen 
koulutus taas opettaa analysoimaan kielellisten merkitysten syntymisen 
mekanismeja. Toisaalta Rampton (mp.) tuo esiin, että etnografia voi aut- 
taa lingvistejä tarkastelemaan tutkimuksensa lähtökohtia. 

Vaikka lingvistisen etnografian yhtenä vahvuutena voi nähdä yksityis- 
kohtaisen ääni- ja videotallenteiden analysoinnin, muunkinlaisilla ai- 
neistoilla on lingvistisessä etnografiassa tärkeä rooli. Copland ja Creese 
(2015, 52) huomauttavat, että on myös sellaisia lingvistisesti orientoitu- 
neita etnografisia tutkimuksia, joiden aineistoissa ei ole lainkaan vuo- 
rovaikutustallenteita. Muistiinpanot ja kenttäpäiväkirja auttavat koh- 
distamaan katsetta toistuviin, merkittäviin tapahtumiin ja toimintaan. 
Tarkoista muistiinpanoista pystyy myös tietyin reunaehdoin analysoi- 
maan vuorovaikutuskuvioita (ks. Lehtonen 2015). On tietysti otettava 
huomioon, että tallenteen puuttuessa analyysi perustuu vain hetkellisiin 
havaintoihin. Jos samantapaisia toimintoja toistuu tilanteissa, havainnot 
kuitenkin tukevat toisiaan. Olennaista tällaisessa lähestymistavassa on 
se, että tutkija on havainnoinut vuorovaikutustilanteita riittävän kauan 
erottaakseen toistuvat ja poikkeukselliset tilanteet toisistaan. 

Koska lingvistisen etnografian kysymyksenasettelut usein ohjaavat 
sosiaalisen indeksisyyden tarkasteluun, tarvitaan niin sanottua meta- 
pragmaattista aineistoa: toimintaa, joka kommentoi toimintaa, puhet- 
ta, joka kommentoi puhetta. Tätä sisältyy myös spontaaneihin ääni- ja 
videotallenteisiin mutta usein myös haastatteluihin. Erityisesti meta- 
pragmaattista aineistoa pyritään keräämään niin sanotuissa retros- 
pektiivisissä haastatteluissa, joissa osallistujat mahdollisesti aineistoja 
nähtyään kommentoivat omaa toimintaansa. On kuitenkin keskeistä 
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ymmärtää, että haastatteluraporttikaan ei ole mikään absoluuttinen to- 
tuus tai lopullinen varmistus: sekin on yksi vuorovaikutustilanne mui- 
den joukossa, ja sitä on tarkasteltava sen omilla ehdoilla. Kyse ei siis 
ole pelkästään aineiston validoinnista, kun tutkimukseen osallistujaa 
haastatellaan ja tämä reflektoi toimintaansa jossakin vuorovaikutus- 
tilanteessa. Kieli, puhe ja toiminta ja näitä kommentoiva kieli, puhe ja 
toiminta ovat yhtä ja samaa prosessia, jossa merkitykset ja tulkinnat 
syntyvät. Myös tutkijan toiminta on osa tuota samaa prosessia, minkä 
hyväksyminen tavallaan mitätöi tarkkailijan paradoksin (paradoksista 
ks. Haastattelu aineistonkeruun metodina sosiolingvistiikassa tk.). Me 
kaikki paitsi tuotamme kieltä myös tulkitsemme sitä sekä asemoimme 


itseämme ja muita tulkintoihimme. 

Lingvistisen etnografian aineisto ja analyysi ylittävät mikro- ja makro- 
tason rajan: tavoitteena on juuri kuvata linkki yksilöiden vuorovaiku- 
tuksen ja laajempien yhteiskunnallisten valtasuhteiden ja rakenteiden 
välillä (Copland & Creese 2015). Jotkut tutkijat ovat myös kokonaan 
kyseenalaistaneet jaon mikro- ja makrotasoon: missä muualla laajem- 
min jaetut merkityksetkään syntyisivät kuin yksilöiden vuorovaikutus- 
toiminnassa? (Heller 2011; Martin-Jones, Andrews & Martin 2017; ks. 
myös Diskurssianalyysi tk.) Keskustelunanalyysissa, jolla on yhteistä 
historiaa lingvistisen etnografian kanssa, on keskitytty nimenomaan 


vuorovaikutuksen mikrotasoon. Yksi sen lähtökohdista on, että yh- 
teyksiä laajempiin merkityksiin ei pitäisi etsiä tarkasteltavana olevan 


keskustelukontekstin ulkopuolelta (ks. Keskustelunanalyysi ja vuoro- 
vaikutuslingvistiikka tk.). Eri aineistojen ja kontekstien yhdistäminen 


voikin aiheuttaa metodologisia ristiriitoja lingvistisen etnografian ja 
keskustelunanalyyttisen perinteen välillä, sillä lingvistinen etnografia 
ja vuorovaikutussosiolingvistiikka hyödyntävät vuorovaikutuksen ana- 
lyysissaan keskustelunanalyysin työkaluja mutta eivät sitoudu kaikkiin 
sen reunaehtoihin, esimerkiksi vaatimukseen siitä, että kaikki analyysin 
kannalta olennainen olisi osoitettava juuri analysoinnin kohteena ole- 
vasta keskusteluaineistosta (ks. esim. Day & Kjaerbeck 2013, 19; Lehto- 
nen 2015, 57-58). Vuorovaikutusanalyysin yhdistäminen laajemmin jaet- 
tuihin sosiaalisiin merkityksiin, esimerkiksi se, millaisiin ideologioihin 
ja stereotypioihin aiemmin mainitut mina ei suami puhu -performanssit 


366 HEINI LEHTONEN JA SARI PÖYHÖNEN 


liittyvät, onkin kysymys, joka vaatii lingvistisen etnografian harjoittajalta 
metodologista kurinalaisuutta ja valmiutta kyseenalaistaa omaa analyy- 
siaan ja positiotaan — ja kuitenkin se on sellainen kielen kuvauksen ky- 
symys, johon vastaamisessa juuri lingvistisessä etnografiassa on päästy 
huomattavan pitkälle. 

Lingvistinen etnografia (tai etnografia yleensä) ylittää usein rajoja 
myös siinä, millä tavalla tutkimustuloksia esitellään ja levitetään. Mo- 
nissa etnografisissa projekteissa hyödynnetään esimerkiksi myös taiteen 
keinoja (ks. esim. Haapakangas, Pöyhönen & Serkamo 2017; Bradley & 
McKay 2016).5 Taide voi olla analyysin kohde, ja taiteilijoiden ja tutki- 
joiden työt voivat myös ruokkia toisiaan (Lehtonen & Pöyhönen 2019). 
Etnografi keskittyy tavallisesti jäljittämään toimintayhteisön vuoro- 
vaikutusta, kun taas taiteilijalle voi olla olennaisempaa lopputulos ja 
toiminnan reflektointi, kuten maalaus tai teatteriesitys ja siitä saatu pa- 
laute. Kummatkin tarvitsevat toisiaan tavoitteiden toteuttamiseksi. Joka 
tapauksessa taiteella ja etnografialla on yhteinen tavoite siinä, miten ne 
pyrkivät välittämään psykofyysisiä kokemuksia jostakin tilasta, ajasta 
ja paikasta. Koska etnografian tarkoitus on kuvata osallistujien koke- 
musta ja näkökulmaa, etnografi on myös kentälle velkaa sen, että tuo 
tutkittavien äänen kuuluviin yhteyksissä, joissa se ei muutoin kuuluisi 
mutta joissa heitä koskevista asioista päätetään tai keskustellaan. Siksi 
yleistajuinen kirjoittaminen tai puhuminen on olennainen osa monen 
etnografin työtä. Fpäoikeudenmukaisten valta-asetelmien tarkkailu saat- 
taa kutsua myös kansalaisaktivismiin, mikä ravistelee tutkijan rooleja ja 
rajoja (ks. Lehtonen & Pöyhönen 2019). 


4. Yhteenveto 


Olemme tässä artikkelissa kuvanneet lingvistisen etnografian histo- 
riallista taustaa ja ymmärrystä kielestä, aineistonkeruun periaatteita ja 
käytänteitä, tutkijanpositiota ja tutkimusetiikkaa sekä sitä, millaiseen 
tutkimukseen lingvistinen etnografia soveltuu. 


LUKU 5 LINGVISTINEN ETNOGRAFIA TOIMINTAYHTEISÖISSÄ 367 


Keskeistä lingvistisessä etnografiassa on tutkimuksen suuntaaminen 
vuorovaikutukseen toimintayhteisössä ja siihen, mitä merkitystä tällä 
vuorovaikutuksella on toimintaan osallistuville yksilöille ja laajemmin 
yhteiskuntajärjestelmälle. Olennaista on tunnistaa kielen ja vuoro- 
vaikutuksen kompleksisuus rajaamatta sitä muutamiin muuttujiin tai 
tietyssä tilanteessa tapahtuvaan toimintaan. Lingvistinen etnografia avaa 
siten ikkunan myös ajallis-paikalliseen ulottuvuuteen ja ottaa huomioon 
vuorovaikutuksen toistuvuudet ja poikkeavuudet sekä pysyvyyden ja 
muutoksen. 

Lingvistinen etnografia, kuten etnografia laajemminkin, on tutkimus- 
eettisesti haastavaa. Se edellyttää ymmärrystä siitä, että tärkeintä etno- 
grafisessa tutkimuksessa on luottamuksen rakentaminen ja säilyttämi- 
nen tutkijan ja tutkimukseen osallistuvien välillä. Luottamuksen voi 
menettää varomattomalla toiminnalla kentällä. Huolellinen valmiste- 
lu ja oman toiminnan analyyttinen tarkastelu auttavat tutkijaa tässä 
prosessissa. 


Aiheesta lisää: 


Blommaert, Jan & Jie, Dong. 2010. Ethnographic Fieldwork. A Beginner's 
guide. Bristol: Multilingual Matters. 


Copland, Fiona & Creese, Angela. 2015. Linguistic Ethnography: Collecting, 
Analysing and Presenting Data. London: Sage. 


Gardner, Sheena & Martin-Jones, Marilyn (toim.). 2012. Multilingualism, 
Discourse and Ethnography. London: Routledge. 


Heller, Monica, Pietikäinen, Sari & Pujolar, Joan. 2018. Critical 
Sociolinguistic Research Methods. Studying Language Issues that Matter. 
London: Routledge. 


368 HEINI LEHTONEN JA SARI PÖYHÖNEN 


VIITTEET 


1 Sosiaalinen semioosi käsitteenä liittyy Peircen (ks. esim. 1955) semiotiikkaan, jota sittem- 
min on hyödynnetty indeksisyyttä ja kielen sosiaalista merkitystä tarkastelevassa lingvis- 
tisessä antropologiassa (Silverstein 2003; Agha 2007; Nieminen 2010; Visakko 2015). 

2 Esimerkkinä variaabelista on yksikön 1. persoonan pronomini, jonka variantteja aineis- 
tossa voivat olla vaikkapa minä, mä ja mie. 

3 Lekti-termin lähin suomennos lienee juuri kielimuoto. Lektiä on käytetty kuvaamaan 
mitä tahansa melko selvärajaista kielellisten merkkien joukkoa, jota tietynlaiset ihmiset 
käyttävät tiettyihin tarkoituksiin. Usein lekti on jotenkin nimettävissä, ja lektien rajaus 
voi olla esimerkiksi alueellista (engl. dialect), sosiaalista (engl. sosiolect) tai jopa puhuja- 
kohtaista — tällöin on puhuttu idiolektistä. Ouist (2008) käsittelee artikkelissaan kahden- 
laista lähestymistapaa sosiolingvistiseen variaatioon: sellaista, joka ottaa tarkastelun 
pohjaksi kielimuodon, ja sellaista, joka näkee kielen sosiaalisena toimintana. 

4 ”The total linguistic fact, the datum for science of language is irreducibly dialectic in 
nature. It is an unstable mutual interaction of meaningful sign forms, contextualised 
to situations of interested human use and mediated by the fact of cultural ideology.” 
(Silverstein mp.) 

5 Meneillään olevista hankkeista voidaan mainita Koneen Säätiön rahoittamat Liisa Rae- 
vaaran johtama Taide työnä ja työvälineenä (http://urbduuni.fi/), Jyrki Kalliokosken 
johtama Itä-Helsingin uudet Suomen kielet (http://blogs.helsinki.fi/uudetsuomet/) sekä 
Jussi Lehtosen ja Sari Pöyhösen Toinen koti -dokumenttiteatteriprojekti 
(http://www.kiertuenayttamo.fi/esitykset/toinen-koti/). 
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Mika? 

Diskurssianalyysi on väljä, tieteenalarajat ylittävä tutkimusalue, jota 
yhdistää kiinnostus siihen, mitä kielellä tehdään ja miten kieli ja sen 
käyttö yhdistyvät muihin yhteiskunnallisiin ja sosiaalisiin rakenteisiin. 
Diskurssianalyysi on ennen kaikkea empiirinen, luonnolliseen kielenkäyt- 
töön kohdistuva analyysitapa, jossa ensisijaisena tulkinnan kohteena on 
se, miten asiat sanotaan, eikä niinkään se, mitä sanotaan. Diskurssi- 
analyysi on riippumaton tulkittavana olevan aineiston kielimuodosta, ja 
tutkimuskohteena olevaa ilmiötä ymmärtääkseen diskurssianalyytikko 
voi käyttää aineistonaan erilaisia kielimuotoja samaan aikaan. 


Katso myös: 


Johdannon luku 1.6. Miten kielitieteen menetelmillä voidaan vastata ih- 
miskunnan suuriin haasteisiin? 
Luku 20 Tekstintutkimus 


Luku 22 Keskustelunanalyysi ja vuorovaikutuslingvistiikka 
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1. Johdanto 


Zellig Harrisin vuonna 1952 uutena analyysimenetelmänä esittelemä 
diskurssianalyysi perustui siihen ajatukseen, että kielitieteessä — ja kie- 
len kuvauksessa — käytetyt perinteiset kategoriat fonologia (äänneoppi), 
morfologia (muoto-oppi), leksikologia (sanaoppi) ja syntaksi (lauseoppi) 
eivät mahdollista lausetta laajempien yksiköiden mielekästä kuvaamis- 
ta. Niinpä tarvittiin syntaktista tasoa laajempi käsitteellinen kategoria, 
joksi Harris esitteli diskurssin. Kun siis esimerkiksi sanastontutkijan 
analyysin kohde oli sanataso ja syntaktikon lausetaso, diskurssin ana- 
lyysin kohteeksi asettui loogisesti diskurssin taso eli kokonaisuus, joka 
on laajempi kuin vain lause tai virke. Tässä mielessä diskurssianalyysin 
historia on vahvasti lingvistinen. 

Nykyisin diskurssi käsitetään kuitenkin yleisesti eri tavalla: voisim- 
me määritellä sen yleisellä tasolla sosiaalisen toiminnan ja kielenkäytön 
yhteenkietoutumiseksi. Diskurssianalyysi on siis sellaista kielenkäytön 
tutkimusta, jossa kielellinen tulkinta yhdistetään sosiaalisen toiminnan 
tarkasteluun. Brian Paltridge (2012, 2) ilmaisee tällaisen diskurssianalyy- 
sin yleisen tehtävän onnistuneesti todetessaan, että diskurssianalyysin ta- 
voitteena on yhdistää kielen säännönmukaisuuksia sosiaalisen toiminnan 
ja kontekstin säännönmukaisuuksiin. Ensisijaisena tavoitteena on ymmär- 
tää, mitä kielellä tehdään ja millaiseen sosiaaliseen toimintaan se yhdistyy. 

Tässä artikkelissa avaamme diskurssianalyysin taustoja ja niihin liitty- 
viä teoreettis-metodologisia sitoumuksia. Yhdymme diskurssianalyysin 
yleiseen näkemykseen, jonka mukaan diskurssianalyysi ei ole yksi yh- 
tenäinen metodi vaan paremminkin orientaatio tutkia sosiaalisen todel- 
lisuuden ilmiöitä ja sosiaalista toimintaa kielenkäytön kautta (van Dijk 
1997). Tarkemmat analyysin metodit täytyy valita esimerkiksi aineisto- 
tyypin ja tutkimuksen tavoitteen mukaan. Osin tämän vuoksi onkin viime 
vuosina yleistynyt diskurssianalyysin sijasta käytettävä nimitys diskurssin- 
tutkimus (engl. discourse studies) (esim. Angermuller, Maingueneau & 
Wodak 2014; Wodak & Meyer 2016 [2001]). Mielestämme moninaisuu- 
desta huolimatta on kuitenkin aiheellista puhua diskurssianalyysista 
myös omana metodisena otteenaan; se on varsin vakiintunut useilla 
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tieteenaloilla, ja sillä on myös yhteisiä peruspilareita. Näistä olennaisim- 
mat ovat käsitys siitä, että tulkinnan kohteena on todellinen kielenkäyttö, 
ja siitä, että kielenkäytön nähdään paitsi heijastavan myös rakentavan 


sosiaalista todellisuutta (ks. Johdannon luku 2 tässä kirjassa). 

Käsittelemme eritoten asioita, joiden katsomme olevan yhteisiä dis- 
kurssianalyysin erilaisissa toteutustavoissa. Diskurssianalyysia harjoitta- 
vina tutkijoina, opettajina ja aikoinaan myös opiskelijoina saamamme 
kokemuksen perusteella haluamme painottaa myös diskurssianalyysin 
tekemisen käytännön näkökulmaa, eli pyrimme antamaan lukijalle käy- 
tännön välineitä aineiston analysointiin. Vaikka kaikki esittelemämme 
työkalut eivät ole kaikille diskurssianalyysin tekijöille tärkeitä tai edes 
käyttökelpoisia, tavoitteemme on kuitenkin kirjoittaa niin, että lukija 
saisi metodisia mahdollisuuksia ryhtyä rakentamaan oman tutkimuk- 
sensa analyysia. 

Tämä artikkeli etenee seuraavasti: Ensin, osassa kaksi, käsittelem- 
me diskurssianalyysin moninaista historiaa, lähtökohtia ja teoriataustaa 
niin maailmalla kuin Suomessa. Osassa kolme käymme läpi eri suun- 
tausten lähtökohtia sekä mahdollisia aineistoja ja analyysin työkaluja. 
Analyysin keskeisiä käsitteitä on kootusti selitetty myös taulukossa 1. 
Sen jälkeen konkretisoimme näiden työkalujen käyttöä kahden pidem- 
män aineistoesimerkin avulla. Lopussa on yhteenveto sekä suositeltua 
lisälukemistoa. 


Mihin? 


Diskurssianalyysi voi kohdistua yhtä lailla puhuttuun kuin kirjoitettuun 
kieleen, tai sen aineisto voi olla näiden kielellisten modaliteettien ohessa 
tavalla tai toisella visuaalinen. Usein diskurssianalyysi yhdistyy ainakin 
mielikuvissa laadulliseen analyysiin, mutta yhä yleisempää on myös 
korpuslingvististen määrällisten menetelmien soveltaminen. Diskurssi- 
analyysi sopii metodiksi erityisesti sellaisiin tutkimusasetelmiin, jois- 
sa keskeistä on saada tietoa jonkin ilmiön, asian tai käytännön yhteis- 
kunnallisesta tai kulttuurisesta ymmärryksestä ja kielen roolista tuon 
ymmärryksen tuottajana. 
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2. Diskurssianalyysin historiaa ja taustaa 
2.1. Diskurssianalyysin alkutaival 


Kielentutkimuksellisesti käsite diskurssianalyysi voidaan jäljittää Harrisin 
(1952) Language-lehdessä julkaistuun artikkeliin ”Discourse analysis”, 
jossa Harris ehdotti diskurssianalyysia nimitykseksi tietylle metodille, 
joka tarkastelee puheen tai kirjoituksen kielellisten rakenneyksiköiden 
yhdistelmää, sidosteista kokonaisuutta (engl. connected speech/discourse). 
Vaikkakin nykyinen ja varsinkin yhteiskuntatieteissä vakiintunut käsitys 
korostaa diskurssin olevan nimenomaan tulkinnallinen, abstrakti käsite, 
alkuperäinen kielitieteellinen näkemys siis viittasi diskurssilla olemassa 
olevaan kielelliseen kokonaisuuteen. Diskurssianalyysilla ja diskurssi- 
käsitteen ymmärryksellä on kuitenkin useita historiallisia juuria, joita 
kuvaamme alla (kuva 1). Historiallisten vaikutteiden ja juurten moninai- 
suus avaa osaltaan ymmärrystä myös nykypäivän diskurssianalyysi(e)n 
moninaisuuteen. 

Harrisin kanssa samoihin aikoihin, jo 1930-luvulta lopulta alkaen, 
filosofiassa oli vakiinnuttanut jalansijaa niin kutsuttu arkikielen filoso- 
fia, jolla oli ja on huomattavia vaikutuksia diskurssianalyyttiseen meto- 
diin. Arkikielen filosofiassa (esim. Wittgenstein 2001 [1953]) painotettiin 
ajatusta merkityksestä käyttönä, ja kielitieteellisessä metodiikassa tämä 
painotus sai myöhemmän diskurssianalyysin kannalta vaikutusvaltai- 
simman muotoilun kielifilosofi J. L. Austinin puheaktiteoriassa (Austin 
1962) ja sitä täydentävissä näkemyksissä (esim. Searle 1975). Puheakti- 
teorian kantava ajatus on se, että kielenkäyttö on toimintaa ja tekoja, 
eli se on seurauksellista, usein jopa todellisuutta muuttavaa tekemistä. 
Tämä keskeinen ajatus leimaa myös tämän päivän erilaisia diskurssi- 
analyyttisia tutkimusotteita. 

Puheaktiteoriaa voidaan pitää modernin lingvistisen pragmatii- 
kan lähtölaukauksena, ja diskurssianalyysiin se kietoutui erityisesti 
1970-luvulta alkaen harjoitetussa erilaisten kielenkäyttötilanteiden, voit- 
topuolisesti nimenomaan keskustelutilanteiden, kuten luokkahuone- 
keskusteluiden (Sinclair & Coulthard 1975), tutkimuksessa. Nämä 
diskurssianalyysit siis tyypillisesti sovelsivat pragmatiikkaa, lähinnä 
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Kirjallisuuden- `, 
tutkimus 


i Kriittiset ` 
* lähestymistavat 


Kuva 1. Diskurssianalyysin vaikutteita. Kuvassa asiaa lähestytään kielentutkimus- 
lähtöisesti niin, että kielentutkimuksen alueelle (iso ympyrä pohjalla) on tullut 
vaikutteita ulkopuolelta: filosofiasta, yhteiskuntatieteistä ja kirjallisuudentutki- 
muksesta (keltaisella merkityt alat). Sinisellä merkityt alat ovat ensin kehittyneet 
osaksi kielitiedettä ja sitten vaikuttaneet myös diskurssianalyysiin. Näiden vai- 
kutteiden lisäksi syvemmällä, tieteenfilosofian tasolla on huomattava sosiaalisen 
konstruktionismin (esim. Berger & Luckmann 1966) vaikutus. 


puheaktiteoriaa, suullisissa vuorovaikutustilanteissa ilmenevien kielel- 
listen tekojen analyysiin. 

Diskurssianalyysi, joka 1970-luvulla vähitellen nosti päätään omana 
nimikkeenään, lainasi metodeja pragmatiikan lisäksi myös sosiolingvis- 
tiikan piirissä syntyneistä puheen etnografiasta ja lingvistisestä antropo- 
logiasta (Hymes 1974) sekä vuorovaikutussosiolingvistiikasta (Gumperz 
1982), joissa oli olennaista eritellä sitä, kuinka tilannekontekstin tekijät 
vaikuttavat kieleen. Puheen etnografian vaikutukset ovat hyvin selväs- 
ti näkyvissä myös 2000-luvun diskurssianalyysissa, jossa etnografiaa 
hyödynnetään esimerkiksi Hymesin oppeihin perustuen (Blommaert 
2009). Yleisemminkin voi sanoa, että diskurssianalyysi laajasti ottaen 
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jakaa puheen etnografian ja vuorovaikutussosiolingvistiikan keskeisen 
metodisen kiinnostuksen tilannekontekstin tekijöiden erittelyyn (ks. 
Lingvistinen etnografia toimintayhteisöissä; Sosiolingvistiikka tk.). 


Pragmatiikan ja sosiolingvistiikan lisäksi alun perin sosiologian 
alueella syntynyt keskustelunanalyysi (ks. Keskustelunanalyysi ja vuo- 


rovaikutuslingvistiikka tk.) on ollut diskurssianalyysin kehityksessä 
tärkeä tutkimuksellinen lähimaasto. Myös diskurssianalyysissa toki jo 


1970-luvulla tutkittiin keskusteluja, mutta pääpaino oli melko jähmeästi 
keskustelussa käytettyjen puheaktien ja keskustelujen kielellisen raken- 
teen kuvauksessa, kun taas keskustelunanalyysi keskittyi vuorovaikutuk- 
sen sosiaalisuuden kuvaukseen. Diskurssianalyysin kehityksen kannalta 
on joka tapauksessa hyvin olennaista, että vähitellen diskurssianalyysi 
(tai diskurssintutkimus) ja keskustelunanalyysi ovat monilta osin kie- 
toutuneet toisiinsa. Tätä seikkaa havainnollistaa se, että keskustelun- 
analyysin käyttäminen tai soveltaminen on yleistä diskurssintutkimuk- 
sen valtalehdissä (esim. Discourse Studies, Discourse & Society, Discourse 
and Communication tai Text & Talk) julkaistuissa artikkeleissa. 

1970- ja 1980-luvuilla syntyi, ehkä implisiittisestikin, näkemys, että 
diskurssianalyysi on lähinnä puhutun kielen tutkimusta ja että diskurssi 
merkitsee puhetta tai keskustelua nimenomaan puhuttuna kielenä. His- 
toriallisia jälkiä tästä löytyy vieläkin. Usein kategoriat teksti ja diskurssi 
rinnastetaan esimerkiksi opintokokonaisuuksien tai tutkimussuuntaus- 
ten nimissä siten, että puhutaan tekstin- ja diskurssintutkimuksesta (ks. 


Tekstintutkimus tk.). Implisiittisesti viitataan jonkinlaiseen jakolinjaan, 
joka on olemassa erityisesti kielentutkijoiden keskuudessa; sen sijaan 
yhteiskuntatieteiden parissa tehdyn diskurssianalyysin nimityksiä ai- 
neistotyyppi tai kielimuoto (puhuttu tai kirjoitettu) ei näytä ohjaavan 
samalla tavoin. Varsinkin kansainvälisesti katsoen vaikuttaa kuitenkin 
siltä, että diskurssianalyysin (tai diskurssintutkimuksen) käsitteen ala on 
nykyisin sellainen, että se kattaa kaikenlaisen kielenkäytön. 
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2.2. Kielellisestä rakenteesta kohti yhteiskunnallis- 
sosiaalisia tulkintoja 


Tekstien ja diskurssin tutkimuksen historiaan liittyy kiinnostavia rin- 
nakkaisia kehityskulkuja, joista erityisen mielenkiintoisia nykypäivän 
ymmärryksen kannalta tekee niiden konvergenssi ja osin sulautuminen 
yhteen — ainakin siinä mielessä, että erilaiset ja erilaisista traditioista 
kasvaneet tutkimusotteet ovat tulleet osaksi diskurssintutkimusta. Ly- 
hyesti voi sanoa, että 1970- ja 1980-luvuilla diskurssianalyysi eri muo- 
doissaan oli painottunut kielen merkitysresurssien erittelyyn ja niiden 
toiminnan logiikan esittelyyn (esim. Brown & Yule 1983; Schiffrin 
1994), kun taas sittemmin diskurssianalyysi kehittyi kohti sellaista pai- 
notusta, jossa ensisijainen analyysin kohde on yhteiskunta tai sosiaaliset 
ilmiöt ja jossa kielen merkitysresurssit ovat välineitä näiden ilmiöiden 
tarkastelussa. 

Kehitystä kuvaa hyvin yhden diskurssintutkimuksen merkittävän 
suunnannäyttäjän, Teun van Dijkin tuotanto. Van Dijk tuli 1970-lu- 
vulla tunnetuksi erityisesti tekstien kieliopillisten rakenteiden, eritoten 
merkitysrakenteiden tutkijana (esim. van Dijk 1972; 1977). Sittemmin, 
1980-luvulta alkaen, van Dijk siirtyi tutkimaan painokkaasti yhteis- 
kunnallisia aiheita. 1980-luvun loppupuolella voimistui yleisemminkin 
se näkemys, että diskurssianalyysissa ei ensisijaisesti ole kyse kielen 
vaan nimenomaan yhteiskunnan analyysista. Van Dijkin lisäksi mer- 
kittävistä diskurssianalyysin suunnannäyttäjistä samansuuntainen 
kehityskulku, lingvistisen analyysin yhteiskunnallistuminen, näkyy esi- 
merkiksi Norman Faircloughin ja Ruth Wodakin analyyseissa ja niiden 
kohdeyleisöissä. 

Yhteiskunnallisuus ei toki ollut 1980-luvulla diskurssianalyysiin ke- 
hitetty uusi mauste. Jo 1970-luvulla kehittynyt kriittinen lingvistiikka 
oli painokkaan yhteiskunnallista ja poliittista (esim. Fowler, Hodge, 
Kress & Trew 1979), ja varsinkin kriittisenä diskurssianalyysina myö- 
hemmin tunnetuksi tullut diskurssianalyysin muoto on monilta osin 
luontevaa jatkumoa kriittiselle lingvistiikalle. 1970-luvun kriittinen 
lingvistiikka myös hyödynsi tekstisemanttisia, erityisesti kirjoitettujen 
tekstien analyysiin kehitettyjä välineitä, joista tunnetuimpana ja eniten 
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sovellettuna — ja ehkä myös kokonaisvaltaisimpana — voitaneen pitää 
M.A. K. Hallidayn systeemis-funktionaalista lähestymistapaa kielen ku- 
vaukseen (Halliday 1994 [1985]). Hallidayn lähestymistavan merkityk- 
sellisyyttä yhtenä diskurssianalyysin päämetodina on korostanut ennen 
kaikkea se, että varsinkin Faircloughin (esim. 1992; 2001 [1989]; 2003) 
hahmottelema kriittisen diskurssianalyysin analyysitapa nojaa vahvasti 
systeemis-funktionaaliseen kielenkuvauksen malliin. 

Nykypäivän diskurssianalyysia on hyvin vaikea nähdä pelkästään 
kielitieteellisenä metodina, sillä diskurssianalyyttisen metodiikan kehi- 
tykseen vaikutti voimakkaasti 1970- ja 1980-lukujen yhteiskuntatietei- 
den niin kutsuttu kielellinen käänne eli sen tieteenfilosofisen käsityksen 
yleistyminen, että kieli rakentaa eikä vain heijasta todellisuutta ja on 
näin ollen tärkeä yhteiskunnallisen analyysin kohde. Tämä käsitys erosi 
merkittävästi aiemmista yhteiskuntatieteissä vallalla olleista positivis- 
tisista näkökulmista (ks. Johdannon luku 2 tk.). Käsitys vaikutti olen- 


naisesti muun muassa näkemykseen siitä, mitä erilaisista kielellisistä 
aineistoista, kuten haastatteluista, voi tai kannattaa päätellä. 

Metodisesti yhteiskuntatieteellisellä diskurssianalyysilla oli kuitenkin 
alkuvaiheissaan suhteellisen vähän yhteistä kielitieteellisen diskurssi- 
analyysin kanssa. Käytännön työkaluja aineiston tulkintaan lainattiin 
sen sijaan esimerkiksi retoriikasta ja etnometodologisesta keskustelun- 
analyysista (ks. esim. Potter & Wetherell 1987). Osassa yhteiskunta- 
tieteellistä diskurssianalyysia vaikutti — ja vaikuttaa edelleen — vahvana 
myös esimerkiksi foucault'laiseksi kutsuttu perinne (esim. Foucault 
1970), jossa kielenkäyttöä tarkastellaan hyvin abstraktisti makrotasolta. 
Foucault'laisessa näkökulmassa diskurssi ymmärretään käsitteellisesti 
yhteiskunnallis-historiallisena ilmiönä, ja diskurssin analyysia voi edus- 
taa esimerkiksi juuri jonkin tähdellisen yhteiskunnallisen ilmiön syn- 
nyn ja muotoutumisen analyysi. 


2.3. Teoriataustan ja kielikäsityksen muovautuminen 


Yhteiskuntatieteellisen diskurssianalyysin tärkeä anti kielitieteellisel- 
le diskurssianalyysille koskee teoreettista taustaa. Diskurssianalyysin 
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teoriatausta — sen kielikäsitys — perustuu pitkälti yhteiskunnallisen ja 
sosiaalisen todellisuuden rakentumista käsittelevään tieteenfilosofiaan 
(esim. Berger & Luckmann 1966; Foucault 1970), jonka yhteiskunta- 
tieteiden kielellinen käänne toi mukanaan. Tämä sosiaalisena konstruk- 
tionismina tunnettu teoria (tai teoriat) (ks. esim. Burr 2015 [1995]) on 
oppi todellisuuden sosiaalisesta rakentumisesta — ja siinä mielessä 
kielestä, että todellisuuden nähdään rakentuvan sosiaalisesti kielen 
avulla. Sosiaalinen konstruktionismi on sittemmin yleisesti hyväksytty 
diskurssianalyysin lähtökohdaksi myös kielitieteellisesti painottuneissa 
suuntauksissa. 

Toinen tärkeä diskurssianalyyttista tutkimusta laajasti yhdistävä, 
suoremmin kieli-, kirjallisuus- ja viestintätieteiden omaan teoriakehi- 
tykseen liittyvä näkemys perustuu kielen ja merkityksen dialogisuuden 
ja kontekstuaalisuuden periaatteisiin, joita on muotoiltu esimerkiksi 
bahtinilaisessa dialogismissa (Bahtin 1981; 1986 [1953]) sekä sille mo- 
nissa kohdin sukua olevassa jälkistrukturalismissa (esim. Barthes 1993). 
Kokoavasti sanoen dialogististen ja jälkistrukturalististen näkökulmien 
diskurssianalyysiin jättämä jälki koskee erityisesti sekä merkitysten dy- 
naamisuuden, vuorovaikutuksellisuuden ja kontekstisidonnaisuuden 
korostusta että tekijän (tai puhujan) käsitteen haastamista siten, että kiel- 
tä ja kielenkäyttöä ei yksioikoisesti yhdistetä kieltä käyttävään yksilöön. 

Diskurssianalyysin metodiikka on muutoinkin kuin teoriamieles- 
sä saanut tärkeitä vaikutteita ja tutkimuksellisia käsitteitä ja työkaluja 
kirjallisuudentutkimuksen piiristä. Esimerkiksi nimenomaan Barthes 
(1993) kuten myös Genette (1972) ovat antaneet diskurssianalyysille 
eväitä tulkita tekstin ja sen tekijyyden ja erilaisten kerronnan ”äänien” 
suhteita, ja ylipäätään narratiivien ja niiden rakenteiden tutkimus (ks. 
De Fina & Georgakapoulou 2015) on ollut ja on edelleen yksi keskeinen 
diskurssianalyytikkojen tutkimuskohde. Intertekstuaalisuus ja tekstien 
moniäänisyys (Kristeva 1986 [1966]; Bahtin 1981) ovat niin ikään mer- 
kittäviä analyysin kohteita ja analyyttisia kehikkoja diskurssianalyysille. 
Myös genre eli tekstilaji (ks. Mäntynen, Shore & Solin 2006; Heikkinen, 
Voutilainen, Lauerma, Tiililä & Lounela 2012) on keskeinen käsite kir- 
jallisuudentutkimuksen lisäksi diskurssianalyysissa. 
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2.4. Diskurssianalyysin suomalaista historiaa 


Diskurssianalyysi, nimenomaan nimillä diskurssianalyysi tai diskurssin- 
tutkimus, ei vakiintunut kovin nopeasti osaksi suomalaista kielentutki- 
musta. Erilaisia kielenkäytön ilmiöitä kyllä tarkasteltiin monilla kielen- 
tutkimuksen alueilla siten, että myös kansainvälisiä pragmaattisia ja 
diskurssianalyyttisia teorioita ja käsitteitä hyödynnettiin, mutta jälkeen- 
päin tarkasteltuna vaikuttaa siltä, että sen enempää pragmatiikka kuin 
diskurssianalyysikaan eivät hevin päässeet kielentutkimuksen alueen 
kaanoniin. Keskusteluntutkimus sen sijaan vakiinnutti oman aseman- 
sa esimerkiksi lukuisten suomen kielen tutkijoiden opinnäytetöissä jo 
1980-luvun lopulta alkaen. 1990-luvulle ajoittuu joukko tekstintutki- 
muksen aluetta paaluttaneita suomen kielen tutkimuksia, jotka esitte- 
livät ansiokkaasti diskurssintutkimuksellisia ajatuksia esimerkiksi kriit- 
tisestä diskurssianalyyttisesta tulkinnasta ja systeemis-funktionaalisen 
lingvistiikan soveltamisesta suomenkielisiin aineistoihin (esim. Kar- 
vonen 1995; Heikkinen 1999). Tutkimusalueen ja metodin nimitykset 
diskurssianalyysi tai diskurssintutkimus alkoivat yleistyä Suomessa kui- 
tenkin vasta 2000-luvulle tultaessa (esim. Pälli 2003); joskin edelleen 
2000-luvun alkupuolella näyttää kielentutkijoiden keskuudessa olleen 
yleinen tapa käytännössä määrittää tutkimuksen ala sen edustaman 
aineistotyypin kautta siten, että tekstiaineistoja sisältävät tutkimukset 
ovat olleet suomalaisittain tekstintutkimusta ja keskusteluaineistoja 
käyttävät tutkimukset keskusteluntutkimusta. Muuta puhuttua kieltä 
(esim. suulliset haastattelut) aineistoinaan käyttäneet tutkimukset pe- 
rustuivat pääosin muihin, esimerkiksi sosiolingvistisiin metodeihin, 
mikä on sikäli yllättävää, että eri tieteenalat huomioon ottaen puhutun 
kielen haastatteluaineistot ovat hyvin tyypillinen diskurssianalyysin 
aineistomuoto. 

Omaa kieltänsä diskurssianalyysin yleistymisestä metodisena ottee- 
na kertoo se, että ensimmäinen diskurssianalyyttinen suomenkielinen 
kielentutkimuksellisiin tarpeisiin kirjoitettu oppikirja, Kurssi kohti dis- 
kurssia, ilmestyi vasta 2009 (Pietikäinen & Mäntynen 2009). Tarpeesta 
suomenkieliselle oppikirjalle viestii, että kirjaan on vuoteen 2020 men- 
nessä viitattu jo yli 1000 kertaa (Google Scholar). 
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Oppikirjatasolla kuitenkin ylivoimaisesti merkittävin yleinen diskurssi- 
analyyttista tutkimusta suomeksi esittelevä teos lienee Arja Jokisen, Kirsi 
Juhilan ja Eero Suonisen Diskurssianalyysin aakkoset (Jokinen, Juhila & 
Suoninen 1993), jossa esitellään sosiaalisen konstruktionismin teoriaan 
perustuvaa diskurssianalyysia. Painokkaan sijan oppikirjassa sai erityises- 
ti niin sanotun Loughborough'n koulukunnan (esim. Potter & Wetherell 
1987) diskursiivisen (sosiaali)psykologian sen aikaisen työkalupakin si- 
sältö. Samojen kirjoittajien Diskurssianalyysi liikkeessä (Jokinen, Juhila & 
Suoninen 1999) puolestaan heijasteli diskurssianalyysin kehityssuuntia 
edelleen Loughborough’n koulukunnan diskurssianalyytikoiden näke- 
myksiä seuraillen. Sama kirjoittajatiimi on jatkanut arvokasta, varsinkin 
yhteiskuntatieteilijöille suunnattua metodin esittelyä myös 2016 julkais- 
tussa oppikirjassa Diskurssianalyysi (Jokinen, Juhila & Suoninen 2016). 

Olennaista alan suomalaisesta kehityksestä on todeta, että 2000-lu- 
vulla diskurssintutkimukselliset otteet ovat tulleet Suomessa hyvin 
yleisiksi ihmisiä, kulttuuria ja yhteiskuntaa eri tavoin tarkastelevissa 
tieteissä. Kielitieteellinen perusta on monitieteiselläkin alueella edel- 
leen erittäin tärkeä, ja esimerkiksi kielitieteisiin pohjautuvissa käsitteis- 
sä ja kielentutkimuksen piirissä syntyneissä teorioissa ja metodeissa 
on varmasti vieläkin paljon potentiaalia, jota yhteiskuntatieteellisesti 
suuntautunut diskurssianalyysi voi hyödyntää. Mainittakoon esimerk- 
kinä syntaktis-semanttinen temaattisten roolien analyysi ja siihen liit- 
tyvä verbisemanttinen argumenttianalyysi, joka voisi soveltua uutena 
ja jännittävänäkin analyysikehikkona monenlaisiin toimintaa ja sen 
seurauksellisuutta pohtiviin analyyseihin. Vastaavasti esimerkiksi käyt- 
täytymistieteissä, johtamis- ja organisaatiotutkimuksessa tai vaikkapa 
viestintä- ja mediatutkimuksessa on ollut jo pitkään vireillä tieteellisiä 
keskusteluja, jotka voivat edistää myös enemmän kielentutkimuksellisis- 
ta lähtökohdista ponnistavaa diskurssianalyysia. Tällaisista voisi yhtenä 
esimerkkinä mainita niin sanotut käytäntöteoreettiset tutkimusotteet, 
joissa tutkimuksen kohteena olevaa ilmiötä tarkastellaan sosiaalisena 
käytäntönä ja tilanteisena sosiaalisena, kielellisenä, kehollisena ja ma- 
teriaalisena toimintana. 

Kyse on toki yleisemmästä kuin vain suomalaisesta kehityskulusta, 
ja toisaalta Suomessa kuten muuallakin on näkyvissä merkkejä siitä, 
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kuinka ilmiópohjaisuus' osittain korvaa tieteenalaluokituksia esimer- 
kiksi monitieteisten tutkimusryhmien muodossa. Diskurssin eli kielen- 
käytön ja sosiaalisen toiminnan yhteenkietoutuneisuuden analyysi on 
hedelmällinen maasto tällaiselle tieteenalarajat ylittävälle yhteistyölle. 


Mitä tutkitaan? 


Diskurssianalyyttisen tutkimuksen kirjo on niin suuri, että yksittäisiä tut- 
kimuksia tai aiheita mainitsemalla on vaikea antaa kokonaiskuvaa siitä, 
mitä kaikkea diskurssianalyysilla voi tutkia. Laajalla otteella asiaa katsoen 
voitaisiin kuitenkin luetella muutamia suhteellisen tyypillisiä diskurssi- 
analyysin kohdealueita: 


e yhteiskunnalliset epätasa-arvoiset käytännöt ja syrjintä 

e poliittinen retoriikka 

e yhteiskuntaelämään liittyvä kielenkäyttö ja toiminta (esim. kunnallis- 
hallinnon ja sen eri alainstituutioiden kielenkäyttö) 

e yritysten sosiaalisiin käytäntöihin liittyvä retoriikka 

e instituutioiden kertomukset tai muut selonteot itsestään (diskurssi- 
analyysia voi hyvin tehdä vaikkapa yritysten tilinpäätöksistä!) 

e inhimillisten toimijoiden kertomukset tai muut selonteot tutkijaa kiin- 
nostavasta yhteiskunnallisesta tai sosiaalisesta ilmiöstä 

* kielen tai sen käytön rooli osana jotain tiettyä joko institutionaalista 
(esim. muodolliset ammatilliset kokouskeskustelut) tai jotain muuta 
sosiaalista aktiviteettia (esim. kaveriporukan keskustelut kotibileissä). 


Listan jatko on diskurssianalyyttisesta mielikuvituksesta kiinni. Mieli- 
kuvitus on kuitenkin usein sidoksissa havaintoihin: hyvä diskurssin- 
tutkija huomaa säännönmukaisuuksia kohtaamassaan kielenkäytössä 
siten, että hän samaan aikaan näkee sosiaalisia toistuvuuksia ja hypo- 
teesimaisesti peräti selitysmalleja kohtaamaansa kielenkäyttöön liittyen. 


Annamme kaksi lyhyttä esimerkkiä. Eräs tuttavamme totesi kerran mieli- 
piteenään kokouskäyttäytymisestä, että ihmiset puhuvat ja käyttävät 
mielipiteitä organisatorisissa kokouksissa pääosin sen vuoksi, että ha- 
luavat ilmoittaa, että ovat olemassa ja ovat tärkeitä. Tuttavamme ilmaisi 
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asian analogialla, jossa puheenvuoro kokouksessa voisi koostua hänen 
mielestään esimerkiksi seuraavasti: ”Minä nyt puhun, kuulkaa, minä pu- 
hun, se olen minä joka puhun ja minulla on tässä asiaa ja nimenomaan 
minä tässä nyt puhun”. Tällainen havainto — jonka sivumennen sanoen 
oli tehnyt suhteellisen paljon erilaisissa kokouksissa istunut henkilö — 
voisi olla johdettavissa kiinnostavasti systemaattiseen diskurssianalyyt- 
tiseen tutkimukseen kokouspuheenvuoroista. Toinen tuttavamme, myös 
hän vaativassa asiantuntija- ja esimiestehtävässä, kertoi puolestaan ker- 
ran työyhteisöllisenä havaintonaan, kuinka työyhteisöstä löytyy puhetapa 
ja ihmistyyppi, jolle on leimallista negatiivisuuden etualaistaminen, mikä 
näkyy sellaisessa kielenkäytössä kuin tääl ei oo ennenkään, kukaan ei kos- 
kaan, kaikki aina, ennen ei tai argumentaation suunnasta riippuen ennen 
aina. Havainto olisi varsin maukas työyhteisöpuheen analyysin kannalta. 


3. Diskurssianalyysin menetelmiä 


Diskurssianalyysin monenlaisten suuntausten lähtökohdat ja tavoitteet 
näkyvät erilaisissa aineisto- ja menetelmävalintoissa. Seuraavassa esit- 
telemme näitä lyhyesti. 


3.1. Aineistot, suuntaukset ja lähtökohdat 


Koska periaatteessa kaikenlaiset kielenkäytön ja viestinnän muodot ovat 
mahdollisia diskurssianalyysin kohteita, käytettävän aineiston määrittä- 
vät pääosin tutkimuksen tavoitteet ja tutkimuskysymykset. Osin aineis- 
ton valinta riippuu myös kyseessä olevan diskurssianalyysin suuntauk- 
sen perinteistä — toiset suosivat kirjallista aineistoa, toiset keskustelua. 
Aineistoa voi myös täydentää haastatteluilla tai etnografisella havain- 
noinnilla, jotta saavutetaan parempi ymmärrys kontekstista. Nykyään 
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pidetään enenevässä määrin myös tärkeänä, että analyysissa ei keski- 
tytä pelkästään kielen analyysiin vaan huomioidaan multimodaalisuus. 
Erityisesti internetin ja sosiaalisen median jatkuvasti kasvavan merki- 
tyksen myötä tämän näkökulman olennaisuus korostuu: suuri osa päi- 
vittäin kohtaamistamme teksteistä sisältää myös kuvallisia elementtejä 
ja videota. Tässä yhteydessä on syytä tuoda esiin sekin, että vaikka dis- 
kurssianalyysi on aina joltain osin laadullista, nykyisin on suhteellisen 
yleistä yhdistää analyysimenetelmään myös määrällisiä korpustyökaluja 
(korpusten käytöstä ks. Laadullinen aineistopohjainen kielentutkimus; 


Korpusaineistot; Määrällinen korpuslingvistiikka; Historiallinen korpus- 


lingvistiikka tk.), tietenkin niin, että ne palvelevat diskurssianalyysin 
tavoitteita (ks. esim. Baker ja muut 2008; Lillgvist 2019). Osuva nimitys 
korpuksia hyödyntävälle diskurssintutkimukselle onkin korpusavusteinen 
diskurssianalyysi. 

Suuremmat aineistot ja korpusmenetelmien tarkoituksenmukainen 
soveltaminen voivat eittämättä auttaa säännönmukaisuuksien löytämi- 
sessä ja niiden osoittamisessa (ks. esim. Mautner 2016) — mikäli siis 
tutkimuskysymys on asetettu siten, että tarkasteltavasta ilmiöstä on 
tarkoitus osoittaa säännönmukaisuutta tai yleisyyttä. Tyypillisesti dis- 
kurssianalyyttista otetta aineiston tulkintaan luonnehtii kuitenkin joko 
induktiivinen, yksittäisistä havainnoista kohti yleisempiä tulkintoja 
kohdistuva päättely tai abduktiivinen, teoriasidonnainen päättely, jossa 
vähälukuinenkin joukko havaintoja voi olla kiinnostava, kun se liittyy 
esimerkiksi olemassa olevan teoreettisen keskustelun käsitteisiin ja 
johtoajatuksiin. 

Diskurssintutkimuksen erilaisia suuntauksia voidaan erotella kar- 
keasti sen mukaan, millaisista ilmiöistä ne ensi sijassa haluavat tuot- 
taa tietoa. Toiset pitävät tärkeimpinä sosiaalisia tai yhteiskunnallisia 
ilmiöitä, joita erilaisten kielenkäytön tapojen analysointi voi valottaa, 
toiset puolestaan ovat erityisen kiinnostuneita kielenkäytön ilmiöistä 
aidoissa sosiaalisissa käyttökonteksteissa. 

Esimerkiksi kriittisessä diskurssianalyysissa keskitytään yhteis- 
kunnallisesti merkittäviin ilmiöihin, kuten ideologioihin ja valtaan, 
sekä siihen, kuinka nämä synnyttävät ja ylläpitävät epätasa-arvoa. Tä- 
män vuoksi tutkimusprosessissa lähdetään usein liikkeelle tietystä 
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yhteiskunnallisesta ongelmasta ja kerätään tätä mahdollisimman hy- 
vin havainnollistavaa aineistoa. Vaikka kriittistä diskurssianalyysia 
luonnehtii melko yksityiskohtainen kielellinen analyysi (Fairclough 
2003) ja vaikka sen kautta toki saadaan tietoa myös kielen merkitys- 
potentiaalista ja kielen rakenteista käytössä, pääasialliset tavoitteet ja 
tutkimuskysymykset liittyvät siis yhteiskunnallisiin ja sosiaalisiin ilmi- 
öihin. Kriittisessä diskurssianalyysissa voidaan esimerkiksi tutkia, miten 
maahanmuuttajista puhutaan ja kirjoitetaan, ja valita aineistoksi media- 
tekstejä tai poliittisia puheita, joissa maahanmuuttoa käsitellään. Toi- 
saalta aineistonkeruun lähtökohdaksi voidaan ottaa muukin kiinnosta- 
vaksi ja merkittäväksi koettu asia tai henkilö, esimerkiksi Donald Trump 
ja hänen retoriikkansa tai EU:n toimielimissä käytetty argumentaatio. 
Kriittisen diskurssianalyysin pyrkimys yhteiskunnallisesti merkittävien 
kysymysten äärelle kuitenkin tarkoittaa sitä, että myös tarkasti rajatut 
analyysin kohteet kertovat jostain laajemmasta ilmiöstä (kuten populis- 
mista, rasismista tai uusliberalismista). 

Toisaalta taas esimerkiksi diskursiivisen psykologian mukainen tai 
siitä ponnistava diskurssianalyysi keskittyy usein sosiaalipsykologisiin 
ilmiöihin, kuten siihen, kuinka psykologisia tiloja ja tunteita käytetään 
ja tuotetaan teksteissä tai puheessa. Tutkija voi kohdistaa analyysin julki- 
siin, institutionaalisiin (esim. työpaikoilla tapahtuviin) tai arkipäiväisiin 
teksteihin tai keskusteluihin, joissa esimerkiksi psykologisoivia ku- 
vauksia ja termejä tai yleisemmin vain ”psykologisointia” käytetään. 
Tavoitteena ja tutkimuksen motivaationa on ennen kaikkea ymmärtää 
psykologisten kuvausten ja siihen liittyvän retoriikan sosiaalista seu- 
rauksellisuutta (Wiggins & Potter 2008). Toisaalta tavoite voi olla myös 
valaista kielen rakenteisiin kiteytynyttä psykologisuutta. 

Kielenkäytön ilmiöihin keskittyvät usein esimerkiksi tekstilajeja tai 
retoriikkaa tutkivat diskurssianalyysit. Tutkija voi silloin olla kiinnos- 
tunut ensi sijassa siitä, millaiset piirteet tiettyjä tekstejä tai tietynlaisia 
tekstejä luonnehtivat, ja kohdistaa analyysin kärjen näiden piirteiden 
tarkasteluun. Silti näissäkin lähestymistavoissa voi kyllä paikantaa it- 
selleen tutkittavaksi yhteiskunnallis-sosiaalisen ilmiön, kuten sen, 
mitä tietyillä teksteillä tehdään ja miten ne ohjaavat toimintaa amma- 
tillisissa tilanteissa (esim. Devitt 1991; Bazerman 1997). Sama pätee 


388 PEKKA PÄLLI JA ELLA LILLOVIST 


intertekstuaalisuuteen ja narratiivisuuteen, jotka molemmat varsin 
usein esiintyvät diskurssianalyysin metodeina joko itsenäisesti tai mui- 
hin analyysitapoihin kytkeytyneinä. Intertekstuaalisuuden tutkija voi 
painottaa joko funktiota eli sitä, mitä intertekstuaalisuus saa aikaan, tai 
rakennetta eli sitä, millaisin keinoin intertekstuaalisuus esimerkiksi 
tietyntyyppisissä teksteissä rakentuu. Narratiiveja eli kertomuksia tutki- 
va voi niin ikään olla enemmän kiinnostunut joko kertomusten raken- 
teellisista ominaisuuksista tai niiden funktioista. Vastaavaa voi sanoa 
esimerkiksi multimodaalisista ja vuorovaikutuslingvistisistä analyysi- 
tavoista, jotka nekin voivat keskittyä enemmän joko rakenteeseen tai 
käyttöön ja käytön sosiaalisiin vaikutuksiin. 

Olennaista on siis, että kyse on painotuksista. Hedelmällisempää 
kuin esitellä sellaisenaan erilaisia suuntauksia ja koulukuntia onkin 
hahmottaa diskurssianalyysin kenttää erilaisten tavoitteiden ja työkalu- 
jen yhdistelmien kautta. 


3.2. Analyysin työkaluja 


Analyysimenetelmän valintaa ohjaavat tutkimuksen tavoitteet, aineisto- 
tyyppi ja aineiston määrä. Analyysissa voidaan keskittyä yhteen hyvinkin 
tarkkarajaiseen näkökulmaan tai vain yhteen analyyttiseen käsitteeseen, 
kuten narratiivisuuteen tai metaforiin. Usein analyysin tekijä kuiten- 
kin käyttää useampaakin työkalua, jotka voivat liittyä erilaisiin kielen ja 
vuorovaikutuksen keinoihin, tekstuaaliseen ja sosiaaliseen kontekstiin 
tai esimerkiksi siihen, millaisista osista teksti tai vuorovaikutustilan- 
ne koostuu, mistä aiheista puhutaan tai missä suhteessa asiat saavat 
huomiota. 

Olennaista on, että menetelmän valintaan vaikuttavat analyysin te- 
kijän havainnot siitä, mitä aineistossa on. Joskus sellainenkin tapa voi 
toimia, että tutkija valitsee etukäteen jonkin analyyttisen työkalun tai 
kehikon ja yksinkertaisesti vain järjestelmällisesti tutkii oman aineis- 
tonsa tuon työkalun kautta. Tavanomaisempaa ja yleensä toimivampaa 
on kuitenkin, että tutkijalla on mielessään alustava tutkimusongelma 
ja tutkimusasetelma, joita vasten hän tekee ensin alustavia havaintoja 
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siitä, millaiset kielenkäytön ilmiöt korostuvat juuri hänen aineistossaan. 
Todennäköisesti nuo havainnot liittyvät johonkin tai joihinkin käsitteistä 
ja ilmiöistä, joita esittelemme taulukossa 1 ja luvuissa 3.3. ja 3.4. käsitte- 
lemissämme kahdessa esimerkissä. Niinpä näitä analyyttisia käsitteitä 
ja niihin liittyvää teoreettista tietoa sekä esimerkkejä muiden tutkimuk- 
sista käytetään oman analyysin perustelemiseen ja systematisoimiseen, 
ja samalla oma analyysi osallistuu diskurssianalyyttiseen keskusteluun 
kyseisestä käsitteestä tai työkalusta. 

Taulukkoon 1 on koottu muutamia diskurssianalyysissa usein käytet- 
tyjä analyyttisia käsitteitä selityksineen. Taulukossa kerromme käsittei- 
den tutkimusalaperustan, annamme selityksen, jossa kuvaamme käsi- 
tettä lyhyesti nimenomaan sen diskurssianalyyttisen hyödynnettävyyden 
kannalta, sekä lisäksi koetamme muutamalla esimerkinomaisella mah- 
dollisella tutkimuskysymyksellä valottaa sitä, miten käsite voisi liittyä 
erilaisiin tutkimuskysymyksiin. Seuraavaksi annamme kaksi erilaista 
esimerkkiä aineistotyypeistä ja mahdollisista analyysin näkökulmista 
niihin. 


3.3. Esimerkki kirjalliseen aineistoon perustuvasta 
diskurssianalyyttisesta tulkinnasta 


Ensimmäinen esimerkki, jolla havainnollistamme diskurssianalyytti- 
sia menetelmiä käytännössä, on eduskunnan tiedote kyselytunnista 
21.9.2017 (ks. esimerkki 1). Teksti keskittyy pienituloisten eläkeläisten 
asemaa koskevaan keskusteluun eduskunnassa, ja se voisi siten olla 
osana aineistoa esimerkiksi tutkimuksessa, jonka tavoitteena olisi sel- 
vittää, miten köyhyydestä puhutaan politiikassa tai laajemminkin yhteis- 
kunnassa. Tällöin aineisto todennäköisesti sisältäisi eduskunnan tiedot- 
teiden lisäksi paljon muunkinlaisia tekstejä. 

Toisaalta tekstiä voisi tarkastella siitä näkökulmasta, millainen teksti- 
lajinsa edustaja se on: silloin muu aineisto koostuisi myös tiedotteista. 
Näin voitaisiin vertailla tätä tekstiä muihin tiedotteisiin, joko esimerkik- 
si tiedotteisiin ylipäätään tai nimenomaan muihin eduskunnan kysely- 
tunteja koskeviin tiedotteisiin. Vertailemalla tekstiä muihin vastaaviin 
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Taulukko 1. Diskurssianalyysin käsitteitä. 


narratologia 


Käsite Perusta Selitys Analyysin kysymyksiä 
Fokalisointi Teksti- Näkökulma ja kerronnan perspektiivi (eri- Kenen näkökulmasta 
(fokus, lingvistiikka, | tyisesti Genette 1972). kuvaus on tehty? Millä 
fokalisaatio) | kirjalli- keinoilla näkökulmia 
suuden- kielellisessä kuvauksessa 
tutkimus, luodaan ja vaihdellaan? 


Mitä niillä tehdään? Mitä 
valittu näkökulma tuo 
esiin ja korostaa? 


(kognitiivinen toimintaa), behavioraaliset 
(käyttäytyminen), verbaaliset (sanomi- 
nen), relationaaliset (oleminen ja omista- 
minen), eksistentiaaliset (olemassaolo tai 
olevaksi tulo) prosessit. (Halliday 1994.) 


Teema/ Teksti- Informaation esittäminen tekstissä vanha- | Miten asioita esitetään 
reema, lingvistiikka | na tai uutena ja juonen ja argumentaation | uusina tai jo tunnettuina 
teema- eteneminen temaattisesti (Danes 1974). ja mitä tämä merkitsee 
progressio, kuvaukselle (esim. sen 
informaatio- näkökulmalle)? Millainen 
rakenne teeman eteneminen luon- 
nehtii esimerkiksi tietyn- 
laisia tekstejä? 
Makro- Teksti- Semanttisten makrotason sääntöjen Millaiset makroproposi- 
propositio lingvistiikka, | (esim. yleistäminen, poistaminen, yhdis- tiot luonnehtivat tarkastel- 
kogni- täminen) kautta luodut tiivistykset. Kukin tavia tekstejä? Mitkä ovat 
tiivinen tekstikappale on kuvattavissa makro- keskeiset aihepiirit? Miten 
diskurssi- propositiolla, joka tiivistää kappaleen tarkasteltavien tekstien 
analyysi esim. yhdeksi lauseeksi. (Esim. van Dijk logiikka tai argumentaatio 
1977.) rakentuu makropropo- 
sitiosta toiseen? 
Koheesio ja Teksti- Kielellisen esityksen sidosteisuus, jota Miten sidosteisuuden 
koherenssi lingvistiikka | tuotetaan esimerkiksi kielellisillä sidos- keinot tietyssä kontekstis- 
keinoilla (esim. yhdistävät konnektiivit, sa käytettynä rakentavat 
toisto tai teema-reema-vaihtelu). Kohe- tekstin tulkinnallista 
renssi ymmärretään yleensä laajemmin logiikkaa? Millä tavoin 
lukijan tekstiin heijastamana tulkinnalli- koheesiokeinot ohjaavat 
sena logiikkana, jota vasten hän tulkitsee kulttuurisen tulkinnan 
tekstin mielekkääksi. Koherenssi koostuu tekemistä esimerkiksi 
erilaisista kontekstuaalisista, sosiokulttuu- | asioiden syy-seuraus- 
risista ja kielellisistä yhteyksistä. (Halliday | suhteista tai yhdistymises- 
& Hasan 1976.) tä toisiinsa? 
Prosessi- Teksti- Kielellistä esitystä voidaan katsoa lau- Millaiset prosessit 
tyypit lingvistiikka, | se-, virke-, tai myös laajemmalta tasolta luonnehtivat tietynlaisia 
systeemis- eritellen siitä kielellisiä prosessityyppejä tekstejä — tai tietynlaisista 
funktio- ja niihin kytkeytyvien osallistujien ja olo- aihepiireistä kirjoittamista 
naalinen suhteiden luonnetta. Pääprosesseja ovat tai puhumista? Millaisia 
kielitiede materiaaliset (tekeminen), mentaaliset eroja on esimerkiksi 


tiettyjen henkilöiden tai 
ryhmien käyttämissä 
(tai heistä käytetyissä) 
prosessikuvauksissa? 
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Kasite Perusta Selitys Analyysin kysymyksia 
Temaattiset Syntaksi, Sijakielioppiin (Fillmore 1968) perustuva Miten erilaiset sijaroolit 
(semantti- semantiikka | nakemys kielellisen (lausetason) kuvauk- toimivat merkitys- 

set) roolit sen funktionaalista merkitystä kantavista resursseina kielellisessä 


yksiköistä, joilla on ”sija” suhteessa verbin 
ilmaisemaan toimintaan. Rooleja erotel- 
laan hieman eri määriä ja eri tavoin, mut- 
ta tyypillisiä ovat esimerkiksi agentti eli 
tekijä, instrumentti eli väline, patientti eli 
vastaanottaja, kokija (experiencer), hyötyjä 
eli benefaktiivi, lähde (source) ja määrän- 
pää (goal). (Fillmore 1968; Frawley 1992.) 


kuvauksessa? Mitä rooleja 
kuvaus hyödyntää? Mil- 
laista systematiikkaa ja 
millaisia sosiaalisia tulkin- 
toja kielellisen kuvauksen 
rooleihin liittyy? 


Leksikaaliset | Seman- Sanatason merkityssuhteet, eli jostain Millaisen näkökulmia ja 

merkitys- tiikka, aiheesta puhuttaessa käytössä olevat sa- merkityksiä — diskursseja 

suhteet retoriikka nastolliset valinnat ja niiden semantiikka. — tekstin leksikaalisiin va- 
Diskurssianalyytikko voi katsoa merkitys- lintoihin kytkeytyvät mer- 
suhteita (esim. polysemiaa, synonymiaa kityssuhteet tuovat esiin? 
tai antonymiaa) valintoina, jotka nostavat | Voidaanko esimerkiksi 
esille erilaisia merkityksiä ja ohjaavat tul- eri toimijoiden tekstien 
kintaa. Merkityssuhteisiin kuuluvat myös välillä huomata sellaisia 
assosiatiiviset (”sivu”) merkitykset, joita diskurssin eroja, jotka 
tiettyyn valintaan liittyy (esim. konnotaa- näkyisivät sanastollisissa 
tiot, kollokaatiot tai affektisuus) (Leech merkityssuhteissa? 
1974). 

Modaalisuus | Semantiikka | Kielen keinot, jotka ilmentävät puhujan Millaisia esimerkiksi 
asenteita puhuttavaan asiaan: esim. pu- tietämiseen (episteemi- 
hua asioista mahdollisina, toivottavina tai nen mod.), tahtomiseen 
epätoivottavina, varmoina tai epävarmoi- (deonttinen mod.) tai ky- 
na, pakollisina, luvallisina tai välttämättö- kyyn (dynaaminen mod.) 
minä. (Nuyts 2005.) liittyviä keinoja käytetään 

vuorovaikutussuhteiden 
rakentamiseen? 

Varaukset Pragma- Tiedon tai toiminnon merkitseminen epä- | Millaisten toimintojen 

(hedges) tiikka varmaksi tai ilmaisun sisällön modifiointi, | kuvauksiin liitetään va- 

ja dialogi- esimerkiksi lieventäminen. Lähellä varauk- | rauksia? Millaisia sosiaa- 

partikkelit sia ovat myös dialogi- tai diskurssipartik- lisia selityksiä varauksille 

(diskurssi- keleiksi, pragmaattisiksi partikkeleiksi tai voidaan antaa? Miten ne 

partikkelit) diskurssin merkitsimiksi nimitetyt pikku- muuttavat merkityksiä 


sanat (no, ai, tota), jotka tilanteisesti luon- 
nehtivat puhujan asenteita tai joilla puhu- 
ja osoittaa tulkintaansa aiemmin puheena 
olleesta. (Maschler & Schiffrin 2015.) 


tilanteessa? 
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Selitys 


Analyysin kysymyksia 


Subjektius viittaa sekä näkökulmaisuuteen 
asioiden esittämisessä että rooleihin, joita 
eri ihmisryhmille yhteiskunnassa tarjotaan 
tai joita puhujat itse tämän seurauksena 
tiedostamattomastikin omaksuvat. Sub- 
jektius on yhteydessä subjektiviteettiin: 
omaksuttuaan tietynlaisen position henki- 
lö näkee, kokee ja kertoo tämän position 
kautta hyödyntäen siihen kuuluvia metafo- 
ria, sanastoa, henkilötoimijuuksia, selon- 
tekomalleja ja skriptejä sekä tarinalinjoja. 
(Davies & Harré 1990.) 


Millaisia subjektiviteetteja 
tai subjektipositioita on 
luettavissa esimerkiksi tie- 
tyn ihmisen tiettyä asiaa 
koskevasta kuvauksesta, 
ja miten erilaiset kielen- 
käytön keinot tukevat 
tulkintoja tietynlaisesta 
positiosta? 


Yleensä diskurssianalyysissa identiteettiin 
viitataan diskurssi-identiteettinä eli sel- 
laisina puhujan valintoina, joiden kautta 
puhuja(t) rakentavat suhdettaan puhutta- 
vaan asiaan, tai rakentavat itseään, kuuli- 
jaa tai ylipäänsä toisia ihmisiä tietynlaisina 
ihmisinä. (Benwell & Stokoe 2006.) 


Millaisiksi itse, puhe- 
kumppani(t) tai muut 
ihmiset kuvataan ja 
miten tämä vaikuttaa 
osallistumisen tapaan tai 
mahdollisuuksiin esimer- 
kiksi tilanteisessa vuoro- 
vaikutuksessa? Millaisia 
säännönmukaisuuksia 
on esimerkiksi tietyn 
ammattiryhmän edusta- 
jien puheessa itsestään? 
Millaisia säännönmukai- 
suuksia on puhetavoissa, 
jotka koskevat esimerkiksi 
jotain yhteiskunnallista 
ryhmää? 


Tavat tehdä asioita oikeaksi, jarjelliseksi ja 
hyväksyttäväksi kielen ja argumentaation 
keinoin. Esimerkiksi mielipide voidaan 
oikeuttaa ja tehdä luonnolliseksi niin, että 
se esitetään virallisena ja siten legitiiminä 
(autorisointi), järkevänä (rationalisointi), 
moraalisesti oikeana (moraalisesti oikein 
ajattelevien pakollisesti hyväksymä) tai kyt- 
kien tarkasteltavan asian tai ilmiön men- 
neisyyteen tai tulevaisuuteen tarinallisesti 
(mythopoiesis) (van Leeuwen 2007). 


Millaisia diskursiivisen 
legitimaation tapoja tietyt 
tekstit hyödyntävät? Mil- 
laisia legitimaatiotapoja 
tietyt tekstit hyödyntävät 
ja millaista todellisuutta 
ne tuottavat? 


Käsite Perusta 
Subjekti- Psyko- 
asema analyysi, 
psykologia, 
narra- 
tiivinen 
tutkimus 
Diskurssi- Yhteiskunta- 
identiteetti tieteellinen 
diskurssin- 
tutkimus, 
psykologia, 
vuorovaiku- 
tuslingvis- 
tiikka 
Diskursii- Kriittinen 
vinen legi- diskurssi- 
timaatio ja analyysi 
luonnollista- 
minen 
Etualais- Kriittinen 
taminen/ diskurssi- 
taka-alaista- | analyysi/ 
minen semiotiikka 


Asioiden esittäminen ja näkökulman valin- 
ta joko niin että ne ovat ”etualalla”, kiin- 
nittävät huomiota, tai jäävät vastaavasti 
taustalle — tätä voidaan tarkastella niin 
kuvista, liikkuvasta kuvasta kuin teksteis- 
täkin. (Fairclough 2001 [1989].) 


Mihin huomio kiinnittyy 
ja millä keinoin? Mitkä 
asiat rakentuvat tekstin 
tai kuvan pääasioiksi tai 
vastaavasti vähemmän 
olennaisiksi? Kenen 
näkökulma kuvauksessa 
korostuu? 
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Kasite Perusta Selitys Analyysin kysymyksia 
Selonteot (Uusi) Tapa tehdä selkoa asioista ja puolustautua | Millainen selontekotapa 
(accounts) retoriikka, esimerkiksi kiistämällä (denial), oikeutta- luonnehtii analysoitavaa 
retorinen malla (justification), selittämällä (explana- | puhetta/tekstejä? Millai- 
psykologia tion), esittämällä (teko)syitä (excuses) tai sia selontekotyyppejä eri 
pyytämällä anteeksi (apologies) (Potter & | toimijat käyttävät? Miten 
Wetherell 1987). tarkemmin ottaen jokin 
selontekotyyppi rakentuu 
tietyssä kontekstissa? 
Retoriset Klassinen Argumentaatiota voidaan tarkastella kä- Millaista retoriikkaa 
rakenteet ja retoriik- sitteiden ethos, pathos ja logos (puhujan analysoitavassa tekstissä 
argumen- ka, uusi uskottavuuteen, tunteeseen ja järkeen käytetään? Miten asiain- 
taatio retoriikka, vetoaminen) kautta. Klassisesta retoriikas- | tiloja tekstissä tai puhees- 
retorinen ta asti on kiinnitetty huomiota myös tar- sa tuotetaan todeksi tai 
(sosiaali) kempiin argumentoinnin keinoihin, joista perustelluiksi tai oikeiksi 
psykologia diskurssianalyysissa hyödynnettyjä ovat retoristen valintojen 
esimerkiksi seuraavat ilmiöt/käsitteet: kautta? Miten jokin tietty 
prolepsis (disclaiming; vastatodistelu) retorinen rakenne esiintyy 
eli puhujan suuntautuminen niihin argu- tietyillä yhteiskunnalli- 
mentteihin, joita hänen oma puheensa silla alueilla tai tietyissä 
potentiaalisesti herättää (en ole rasisti, sosiaalisissa tilanteissa? 
mutta...); dispositionaalinen-vastadisposi- 
tionaalinen puhe eli puhujan tapa osoittaa 
yhtyvänsä kulttuuriseen jäsennykseen 
tai esimerkiksi eroavansa siitä esittäen 
toisen disposition (esim. kun tulee ikää, 
on luontevaa ajatella eläkettä vs. kun tulee 
ikää, on luontevaa ajatella eläkettä, mutta 
minä en...); kvantifikaatioretoriikka eli 
ukumääriin kuten prosentit tai muutoin 
määrällisiin luonnehdintoihin tukeutu- 
minen (esim. kaikki, ei kukaan); skriptit 
(script formulations) eli kielen tiettyjen ra- 
enteiden (kuten jos ...niin) avulla luodut 
oogiset päätelmät ja hypoteesit (esim. 
Edwards & Potter 1992; Potter 1996). 
Implisiittiset | Kriittinen ielellisen kuvauksen taustalla luonnolli- Millaisia taustaoletuksia 
oletukset diskurssi- sina ”näin asiasta ajatellaan” -tyyppisinä analysoitavaan tekstiin 
analyysi, ajatusmalleina olevat oletukset siitä, mitä liittyy? Mitkä asiat siinä 
pragma- on olemassa (eksistentiaaliset oletukset), nähdään itsestään selvi- 
tiikka mikä on, voi olla tai tulee olemaan asiain- nä? Millaisia muutoksia 


tila (propositionaaliset oletukset) ja mikä 
on hyvää tai haluttavaa (arvo-oletukset). 
On myös loogisia implikaatioita, jotka 
voidaan päätellä suoraan ilmaisusta, ja 
konversationaalisia implikatuureja, jotka 
voidaan päätellä keskustelun yleisistä 
periaatteista eli maksiimeista. (Grice 1975; 
Fairclough 2003.) 


tai eroja tekstien tausta- 
oletuksissa on historialli- 
sesti tai paikallisesti? 
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Kasite Perusta Selitys Analyysin kysymyksia 
Kategorisaa- | Retorinen Asioiden, ilmiöiden tai ihmisten (ihmisten | Millaiset kategorisoinnin 
tio ja parti- (sosiaali) = sosiaalinen kategorisaatio) niputtami- avat luonnehtivat esim. 
kularisaatio psykologia, nen yhteen esimerkiksi retorisia tarkoituk- ietyista yksilöistä tai 
kogni- sia varten, tai vastaavasti kielen keinojen ryhmistä käytettyjä puhe- 
tiivinen käyttö asioiden, ilmiöiden tai ihmisten apoja? Miten tietynlaisis- 
psykologia ainutkertaistamiseen (partikularisoimi- sa kielenkäyttötilanteissa 
seen) (Pälli 2003). ai tiettyjen kielenkäyt- 
äjäryhmien toimesta 
kategorisoidaan? 
Puheakti- Pragma- Kielen käyttöön kiteytyneet tulkinnat Millaisia puhetekoja tie- 
tyypit tiikka tehtyjen puhetekojen merkityksistä — esi- yissä tilanteissa tehdään 
merkiksi että komissiivilla (sitoutumista ja miten ne vaihtelevat 
osoittavalla ilmauksella) puhuja sitoutuu esimerkiksi ajassa, pai- 
(tulen tänään teille) tai deklaratiivilla kassa, kulttuureittain tai 
(todellisuutta muuttavalla ilmoituksella) ihmisittäin? Millaiset 
puhuja muuttaa olosuhteita (julistan puheteot luonnehtivat 
väitöstilaisuuden alkaneeksi). Käytännös- tiettyjä toimintoja tai esi- 
sä puheaktit ovat usein mutkikkaita ja merkiksi institutionaalisia 
epäsuoria: jos puhujalla olisi esimerkiksi vuorovaikutustilanteita? 
aie/halu saada kuulija avaamaan ikkunan, 
hän voi käyttää käskyä tai kysymystä, 
joiden tilanteinen tulkinta puolestaan voi 
perustua esimerkiksi puhujien väliseen 
hierarkiaan. (Austin 1962; Searle 1975.) 
Kasvojen Pragma- Tietyt puheteot voidaan nähdä kuulijan Miten tietynlaisissa 
uhkaaminen | tiikka kasvoja uhkaavina tai muutoin sosiaali- konteksteissa kasvoja 
ja uhkaavuu- sesti ongelmallisina tilanteessa. Tämän uhataan tai säilytetään ja 
den lieventä- vuoksi on kielenkäyttöön kiteytyneitä millä vaikutuksilla? Kuin- 
minen keinoja ilmaista periaatteessa uhkaava tai ka esimerkiksi erilaiset 
ongelmallinen puheteko kasvoja uhkaa- puhujaryhmät lieventävät 
matta tai ainakin uhkaa lieventäen, käyttää | kasvojen uhkaa — ja mihin 
esimerkiksi kysymystä käskyn sijasta. tarkoituksiin? 
(Brown & Levinson 1978.) 
Persoona Kielioppi, Diskurssianalyyttinen mielenkiinto per- Keitä sisältyy esimerkiksi 
pragma- soonaan liittyy ennen kaikkea siihen, monikollisten pronomini- 
tiikka mitä persoonaviittauksilla teksteissä viittausten alaan? Millai- 


tai puheessa tehdään ja mitä ovat ne 
mahdolliset sosiaaliset syyt, joilla tiettyjä 
persoonia käytetään tai kaihdetaan. Yksi 
diskurssintutkijoiden kiinnostuksen koh- 
teista on ollut passiivi, johon liittyen on 
keskusteltu esimerkiksi persoonan (usein 
tietoisestakin) hämärtämisestä ja toisaalta 
persoonaisuuden monimuotoisuudesta. 
(Pälli 2003.) 


sessa kontekstissa puhuja 
puhuu minä-muodossa? 
Millaisia merkityksiä nos- 
tetaan esiin esimerkiksi 
geneerisellä persoonalla 
(suomessa nollapersoona 
tai puhekielinen sä) tai 
passiivilla? 
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Kasite Perusta Selitys Analyysin kysymyksia 
Deiksis Kielioppi, Kielen deiktisten tai demonstratiivisten Millaisia säännönmukai- 
pragma- viittaaminen joko kielellisen esityksen suuksia ja niihin liittyviä 
tiikka ulkopuolella (eksofora) tai toiseen koh- sosiaalisia selityksiä 
taan kielellisessä esityksessä (endofora). ilmausten deiktisiin ja 
Diskurssianalyytikolle deiktiset viittaukset demonstratiivisiin ilmauk- 
ovat kiintoisia tilanteisessa käytössään, siin liittyy? Miten tietyt 
jossa ne voivat tuoda esiin erilaisia näkö- tekstit tai muut kielelliset 
kulmia esimerkiksi puhetilanteen henki- esitykset hyödyntävät 
löiden suhteisiin (sosiaalinen deiksis ja deiksistä? 
persoonadeiksis) tai kielellisesti kuvatun 
toiminnan tapahtuma-aikaan (tempus- 
deiksis). (Levinson 2004.) 
Tekstilaji Kirjalli- Sosiaalinen toimintatyyppi, sosiaalisesti Miten tekstilajeja käy- 
(genre) suuden- vakiintunut tapa tehdä asioita tietyllä tetään erilaisiin tavoit- 
tutkimus, viestinnällisellä tavalla. Esimerkiksi tiedote | teisiin? Miten asioita 
tekstien ja tiedottaa; kirjallisella tuotteella ”tiedote” tehdään käyttäen tietoa 
ammatil- on siis vakiintunut viestinnällinen pää- tekstilajeista? Miten teksti- 
lisen vies- määrä ja sen yleinen ymmärrys, sekä lajit liittyvät ammatilliseen 
tinnän niihin liittyvästi vakiintuneet tyypilliset osaamiseen ja ammatin 
tutkimus kielelliset valinnat. (Mäntynen, Shore & sosiaalisiin käytäntöihin? 
Solin 2006.) 
Interteks- Kirjalli- Kielellisen esityksen tavat hyödyntää Miten esimerkiksi tietyn- 
tuaalisuus suuden- muita esityksiä, luoda niihin yhteyksiä ja laisissa teksteissä taus- 
tutkimus, muodostaa yhteyden kautta merkityksiä. talla olevat ajatusmallit 
kriittinen Esimerkiksi lainaaminen tai suora viittaa- siirtyvät toisenlaiseen 
diskurssi- minen, kieliopillinen suora tai epäsuora ympäristöön, toisenlaisiin 
analyysi esitys. Lähitermi interdiskursiivisuus teksteihin intertekstuaa- 
viittaa diskurssien tapaan hyödyntää tai lisuuden keinoin? Miten 
kaiuttaa muita diskursseja, puhetapoja. intertekstuaalisuus tuo 
Liittyy läheisesti moniäänisyyden käsit- tekstiin tai muuhun 
teeseen (polyfonia), eli useiden erilaisten kielenkäyttöön moniääni- 
näkökulmien tai ”äänten” esiintymi- syyden ja mitä seurauksia 
seen samassa tekstissä (Bahtin 1981; moniäänisyydellä on? 
Fairclough 1992). 
Narratiivit ja | Kirjalli- Tarina tai kertomus ja niiden rakenne ja Millaisia kertomuksia 
esimerkit suuden- funktiot (mitä saavat aikaan kielellisen tietynlaiset kielelliset esi- 
tutkimus, esityksen tulkinnan kannalta). Tarkas- tykset hyödyntävät? Miten 
yhteiskunta- | telussa voidaan keskittyä kertomuksen kertomukset vastaanote- 
tieteet, rakenneyksiköihin rakenteeseen tai tark- taan keskustelutilanteessa 
retoriikka kailla kertomuksellisuutta sen funktioiden | tai muussa kielenkäyttö- 


kautta. Kertomuksina tai narratiiveina 
voidaan pitää myös laajemman kielellisen 
interaktion — esimerkiksi keskustelun — 
sisällä olevia ”minikertomuksia” (micro- 
stories), joilla voidaan tulkita olevan 
omia funktioitaan osana sitä laajempaa 
toimintoa, jossa ne esiintyvät. (De Fina & 
Georgakapoulou 2015.) 


tilanteessa? Mitä kerto- 
musrakenteita ja millä 
vaikutuksilla erilaiset insti- 
tuutiot käyttävät? 
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teksteihin saisimme selville, onko tama teksti tyypillinen lajinsa edusta- 
ja. Huomaisimme todennäköisesti, että tämän esimerkin lisäksi muut- 
kin vastaavat tekstit on kirjoitettu asiatyylillä tapahtumia raportoiden, 
ilman että kirjoittaja suoraan ilmaisee mielipidettään, tuo itseään esiin 
tai suuremmin selittää aiheen taustoja. Nopea vertailu muutamaan 
muuhun kyselytuntitiedotteeseen kuitenkin osoittaa, että tämä tiedote 
on lyhempi kuin useat muut lajin edustajat, ja on ehkä yllättävää, että 
tekstissä ei mainita alkuperäisen suullisen kysymyksen esittäjän nimeä 
eikä myöskään jatkokysymysten esittäjiä. Tietenkin paljon laajempi ver- 
tailu olisi tarpeen, jotta tästä voitaisiin sanoa mitään varmaa. 
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Pienituloisten eläkeläisten toimeentulo oli vahvasti esillä eduskunnan kyselytunnilla 
torstaina 21. syyskuuta. Hallitusta kritisoitiin siitä, että se leikkaa jo valmiiksi kaikkein 
heikoimmassa asemassa olevilta ihmisiltä. 


Kansanedustajilla oli huoli siitä, että lääkekorvausten leikkaukset ja terveydenhuollon 
asiakasmaksujen 30 prosentin korotus koettelevat erityisesti ikääntyviä ihmisiä. Käteen 
jäävä eläke ei enää riittää elämiseen, kyselytunnilla todettiin. 


Sosiaali- ja terveysministeri Pirkko Mattilalta (si.) kysyttiin, onko oikein, että budjetti antaa 
jopa 400 euroa varakkaille, kun köyhimmiltä kansaneläkeläisiltä otetaan pois. 


”Meillä on olemassa tukijärjestelmä asumistukeen ja toimeentuloon", Mattila sanoi. Hän 
totesi myös, että kunnat voivat itse päättää, perivätkö ne esimerkiksi terveyskeskusten 
asiakasmaksuja vai eivät. 


Muita kyselytunnin aiheita olivat viittomakielen tulkkauspalvelut, huumeiden käyttö ja 
kielikokeilut 


Kyselytunnin keskustelun voi lukea kokonaisuudessaan taysistunnon paatyttya 
eduskunnan pöytäkirjasta PTK 91/2017 vp tai katsoa jälkikäteen verkkolahetyksen 
tallenteena. 


Täysistunto 


Julkaistu 21.9.2017 20:05 
Muokattu 21.9.2017 20:05 


Esimerkki 1. Kuvakaappaus eduskunnan internetsivuilta, 21.9.2017 julkaistu tie- 
dote. 
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Tekstiä voitaisiin tarkastella myös osana intertekstuaalista ketjua 
(Fairclough 2003), johon kuuluvat ainakin hallituksen esitys kansan- 
eläkeindeksin jäädyttämisestä vuoden 2017 tasolle vuodeksi 2018 (Hal- 
lituksen esitys HE1232017 vp), jota käsiteltiin samana päivänä, itse ky- 
selytunti videotallenteineen, Helsingin Sanomien artikkeli, johon kysyjä 
puheenvuorossaan viittasi, pöytäkirja, johon puheenvuorot on kirjattu 
sanasanaisesti sekä tämä tiedote. Tutkimalla tätä tekstiketjua saisimme 
esimerkiksi selville, mitä käsiteltyjä asioita ja kommentteja tiedottee- 
seen valittiin ja mitä siitä jätettiin pois. Tämä näkökulma avaa kirjoit- 
tajan prioriteetteja: kaikilla teksteillä tehdään tiettyjä asioita erityisen 
merkityksellisiksi ja jätetään toisia vähemmälle huomiolle tai kokonaan 
mainitsematta. Näitä valintoja on usein vaikea yksiselitteisesti tutkia, 
mutta tämän intertekstuaalisen ketjun tapauksessa voimme verrata kes- 
kustelusta tehtyä tiedotetta alkuperäiseen keskusteluun, koska molem- 
mat ovat julkisesti saatavilla. Jo tiedotteesta näemme, että sen kirjoittaja 
keskittyy keskusteluun eläkeläisten toimeentulosta ja mainitsee muut 
kyselytunnin aiheet vain ohimennen. Pöytäkirjasta selviää lisäksi, että 
21 eri henkilöä käytti eläkekeskustelussa yhteensä 38 puheenvuoroa — 
mutta tiedotteeseen on päätynyt vain sosiaali- ja terveysministeri Pirkko 
Mattilan nimi. 

Tämän tyyppisestä tekstistä voisi myös olla kiinnostavaa tarkastella, 
miten tekstissä tuodaan esiin eri toimijoita ja kuinka aktiivisina heidät 
esitetään. Tämä tiedote esimerkiksi asettaa vastakkain ministeri Matti- 
lan ja nimeämättömän joukon kansanedustajia. Epätarkkuutta toimi- 
joiden suhteen lisää passiivin (kritisoitiin, todettiin, kysyttiin) ja muiden 
persoonaviittauksen osalta epäselvien ilmausten käyttö (toimeentulo oli 
vahvasti esillä, Kansanedustajilla oli huoli). Usein analyysiprosessissa voi 
olla hyödyllistä miettiä, miten muuten saman asian olisi voinut ilmaista 
(ks. Kielitaju kielentutkijan työkaluna tk.): esimerkiksi tässä olisi voinut 


myös mainita, ketkä tai minkä puolueen edustajat hallitusta kritisoivat. 
Tällaisen tiedon puuttuminen voi luoda mielikuvaa, että oppositio olisi 
ollut yksimielinen asian suhteen tai että Mattila olisi vastannut kritiik- 
kiin tyhjentävästi. 

Lisäksi kiinnostavaa voisi olla analysoida tekstin sisäistä koherens- 
sia ja sitä, miten asioita siinä yhdistetään ja rinnastetaan. Esimerkiksi 
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tiedotteessa mainittu kysymys ja vastaus eivät tunnu kuuluvan yhteen 
(eivätkä pöytäkirjan mukaan kuulukaan). Itse asiassa ministeri Mattila 
sanoi, useita puheenvuoroja myöhemmin: ”Meillä on edelleen olemassa 
tukijärjestelmä asumistukeen, toimeentuloon, myöskin lääkkeisiin, ja 
niin kuin tässä kuultiin, tämä asiakasmaksulaki myöskin turvaa sen, että 
se voidaan jättää perimättä vähävaraisuuden vuoksi”. 

Erityisesti kriittisesti suuntautuneessa diskurssianalyysissa ollaan 
usein kiinnostuneita tekstin sisältämistä taustaoletuksista; esimerkiksi 
siitä, mitkä asiat nähdään normaaleina, hyvinä ja arvokkaina. Tässä tie- 
dotteessa verbi kritisoitiin viestii siitä, että kritiikin esittäjät pitävät hei- 
koimmassa asemassa olevilta leikkaamista huonona tai moraalittomana 
ratkaisuna. Kansanedustajien huoli viittaa inhimillisiin tunteisiin pieni- 
tuloisia eläkeläisiä kohtaan, joita koetellaan. Toisaalta myös tiedotteen ot- 
sikossa on tunnepitoinen sana ahdinko, mikä vihjaa, että kirjoittaja ehkä 
hyväksyy saman taustaoletuksen. Jälleen voidaan miettiä, millä muilla 
tavoin asian olisi voinut halutessaan muotoilla. Sanat huoli ja ahdinko 
avaavat merkityksiensä kautta kiinnostavasti näkyville myös emootioi- 
den roolin poliittisessa keskustelussa. Kysymys, onko oikein, että varak- 
kaille annetaan ja köyhimmiltä otetaan pois, puolestaan tuo moraalisen 
pohdinnan etualalle. Kysymys kuulostaa ehkä niin sanotulta retoriselta 
kysymykseltä, mutta kyselytunnin yhteydessä kysymys oli sinänsä aito, 
että ministerin odotettiin vastaavan siihen ja hän vastasikin. 


3.4. Esimerkki suulliseen vuorovaikutusaineistoon 
perustuvasta diskurssianalyyttisesta tulkinnasta 


Toinen esimerkkimme on keskustelukatkelma videoidusta keskustelu- 
tilanteesta keskisuuressa, noin 500 henkilöä työllistävässä rahoitus- ja 
myyntiorganisaatiossa (ks. esimerkki 2). Katkelmassa keskustelevat yri- 
tyksen toimitusjohtaja (Esa) ja markkinointijohtaja (Jan). Meneillään 
olevaa keskustelua nimitettiin kyseisessä yrityksessä johtamiskeskus- 
teluksi, mikä tarkoitti sitä, että toimitusjohtaja kävi jokaisen ylempään 
johtoon kuuluvan kanssa läpi keskeisiä asioita yrityksen uudesta stra- 
tegiasta. Ennen keskustelua johtajat olivat täyttäneet kyselylomakkeen, 
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jossa he olivat numeerisesti ja kirjallisesti arvioineet sekä yrityksen että 
myös omien henkilökohtaisten tavoitteidensa saavuttamista ja tavoittei- 
siin liittyviä haasteita. 

Alkuperäinen syy tämän aineiston keräämiseen oli tutkia, miten 
johtoasemissa olevat ihmiset puhuvat strategiasta. Mutta toisaalta ai- 
toja kielenkäyttötilanteita sisältäville aineistoille on tyypillistä, että ne 
taipuvat moniin tarkoituksiin. Kyseisiä keskusteluja voidaan siis tulkita 
strategiakontekstia vasten ja asettaa aineistolle kysymyksiä, kuten mi- 
ten strategiasta puhutaan. Kysymykset voisivat kielenkäytön analyysin 
tasolla tarkentua esimerkiksi siihen, millaisia metaforia strategiasta käy- 
tetään tai millaisissa toimija- tai subjektiasemissa se esiintyy (esimerkki 
tästä ks. Pälli 2018). Samaa keskustelua voisi toki katsoa myös hieman 
erilaisesta näkökulmasta: sen voisi nähdä ilmentävän esimerkiksi johta- 
mista tilanteisena toimintana eli sitä, miten keskustelussa ”johdetaan”. 
Voisi myös kysyä, mitä johtaminen on, millaisia merkityksiä puhujat 
siihen liittävät ja millaisia kielen keinoja he näiden merkitysten tuotta- 
miseen käyttävät. Lisäksi tutkijaa voisi kiinnostaa esimerkiksi työpaikka- 
kulttuuri, joka voitaisiin edelleen yhdistää diskurssianalyyttiseen kes- 
kusteluun vaikkapa naisten ja miesten diskursiivisista johtamistavoista 
(Holmes, Schnurr & Marra 2007). Konteksteja voisi olla monia muita- 
kin diskurssianalyyttisen mielikuvituksen — kyvyn yhdistää kielenkäyttö 
sosiaaliseen toimintaan tai johonkin sosiaalisen toiminnan kontekstiin 
— tarjoamissa rajoissa. 

Myös suullisten vuorovaikutusaineistojen diskurssianalyysi voi pe- 
rustua enemmän kielelliseen havaintoon ja jättää vähemmälle edellä 
mainitun kaltaiset sosiaaliset kontekstit. Diskurssianalyytikko voi huo- 
mata tällaisesta aineistosta jonkin kiinnostavan kielenkäyttöön liittyvän 
ilmiön, jonka kiinnostavuus ei välttämättä ole juuri ollenkaan tekemisis- 
sä esimerkiksi keskustelun puheenaiheen kanssa. Yhtenä mahdollisena 
tulkintasuuntana voisi esittää vaikkapa seuraavan havainnon, joka voisi 
olla mielenkiintoinen myös muissa konteksteissa: Esimerkissä rivillä 
34 Jan sanoo täs on halunnu reagoida- tai olen reagoinu tuoden näin esiin 
oman tietoisuutensa vastuullisesta tekijyydestä. Kolmannen persoonan 
muotoilu on halunnu reagoida sisältää implisiittisesti puhujan mutta sa- 
malla yleistää hänet osaksi laajempaa joukkoa. Tekijyyden ilmaisuun 
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liittyy kuitenkin itsekorjaus olen reagoinu, jonka merkkinä voidaan näh- 
dä kesken jäävä reagoida-sana ja sen jälkeinen tai. Nimenomaan itse- 
korjauksen avulla Jan säilyttää ennen korjausta sanotun relevanssin (vrt. 
Sorjonen & Laakso 2005) ja toisaalta itse alleviivaa tekijyyden, omakoh- 
taisuuden, olevan merkityksellinen kielellinen valinta tässä tilanteessa. 
Riveillä 36—38 Jan jatkaa kommentilla toi meni itse asiassa tunnepuolelle. 
Tässäkin voidaan nähdä tekijyyden tietynlainen etäännyttäminen, sillä 
valittu kielellinen kuvaustapa korostaa puheena olleiden asioiden ”men- 
neen” jättäen samalla tekijän vastuun taka-alalle. Tulkintaa tukee Janin 
kehollinen toiminta. Hän suuntaa puhuessaan katseensa paperiin ja ohi 
keskustelukumppaninsa ja ristii kätensä niin kutsuttuun torjunta-asen- 
toon rinnalleen (rivi 37). 

Diskurssianalyysia edustaisi myös enemmän vuorovaikutustoimin- 
taan perustuva tulkinta siitä, miten organisatorista asemaa rakennetaan 
ja pönkitetään keskustelussa kielen ja vuorovaikutuksen keinoin. Ana- 
lyysissa voisi katsoa systemaattisesti sitä, kuka avaa ja päättää puheen- 
aiheita eli topiikkeja ja millä keinoin. Tällaista analyysia tehtäessä ollaan 
samoilla vesillä keskusteluntutkimuksellisen tulkinnan kanssa. Eroksi 
voidaan nostaa kuitenkin diskurssianalyysille tyypillinen vaatimus myös 
muun kuin keskustelun kontekstin olennaisesta merkityksestä: analyy- 
sin tekijä haluaisi ehkä tutkimuksellaan kertoa nimenomaan siitä, mi- 
ten topiikkien avaaminen, käsittely ja lopettaminen liittyy esimerkiksi 
johtamistyyliin (Svennevig 2011). Diskurssianalyysille on siis leimallista 
pyrkiä sosiaalisen makrotason tulkintoihin, kun keskustelunanalyysi 
kohdentuu tiukemmin juuri keskustelun itsensä kontekstiin. 
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Esimerkki 2. Kahden välistä johtamiskeskustelua organisaatiossa X. Toimitus- 
johtaja (Esa) ja markkinointijohtaja (Jan). 


Litterointimerkinnät: - kesken jäävä ilmaus; [ ] päällekkäispuhunta; no alleviivaus 
merkitsee painotusta; (.) lyhyt tauko; (1.0) tauko sekunneissa; = kaksi puhunnos- 
ta liittyy toisiinsa tauotta; (()) litteroijan kommentit. 


o1 Esa: Onko tota (.) koulutus- (.) ni onks sitä ollu riittävän paljo 


02 


03 


04 


05 


06 


07 


08 


09 


Esa: 


Jan: 


tässä (.) nyt lähivuosina vai- 


: Mm- mehän käytiin (.) siis mä kävin nää peruskurssit (.) sit on 


muutama preppaus ollu jostaki tuotteesta. Ja sitte oli tää (.) Mörkö 
tää- mä en muista enää nimeä ne sano rumasti Möröks sitä yks 
konsultti (.) jonka Miettinen (.) niinku laitto meidät laittaan 
myyntikoulutusta=se oli hyvin erikoinen rupeama se ajo jotain (.) 
käärmettä pulloon yritti ajaa meille. Se oli hyvin erikoinen. Sit oli 
tää- (.) sit oli myyntikoulutusta oli tää jalkapallo Anssi T. Salo 

vai mikä se on. Et ei sitä kauheesti oo ollu kyllä. Ei oo ollu et 
kyllähän meidän täytyy nyt jatkos ni koulutuskalenteriin määritellä 
että siel on ((sanoja poistettu)) mis meil on oikeasti ongelmia (.) 
mut ei sitä hurjasti oo ollu kyllä. Aina vaan vähentyny tässä viime 
vuosina. Et siinä on ollu joku ketunhäntä kainalos ku sitä on tehty. 
Niin voi olla joo. Joo. (4.0) ((molemmat merkitsevät jotain 
papereihin)) Sitte kehittämis- (1.0) työ. 

No tää nyt kyllä on vähä ehkä liiankin raaka tää ykkönen mut tässä 


mä olin niin tuohduksissa sillon kun (.) mä oikeesti- (.) no tähän 
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24 Esa: 


28 Esa: 


38 Esa: 


41 Jan: 


kytkeytyy nyt se huoli tasta talouden tilanteesta ihan oikeesti ma 
mietin et mikä on se ((yrityksen nimi)) olemassa olon oikeutus 
((sanoja poistettu). Ja sitte ku nää puuttuvat työkalut jotka ihan 
oikeesti niin nehän kaikilla kilpailijoilla on jo. Ni se täs 
aiheuttaa sitä minkä takia mä nyt oon sen [tänne alle- 


[Mikä se työkalu on? 


: Työkalut on (.) se liittyy tähän tekniikkaan=ne on nää e-laskut 


sähköset palvelut, lakisääteiset palkkailmoitukset, 
((sana poistettu)) tuote. ((Listaa puhuessaan sormilla, katse ohi)) 


Niin nämä. Joo. 


: Niin nehän on niinku ihan, ne on semmoset mä nään niinku (.) tosi 


pahana juttuna et niit ei oo. Et jos mul ois rahaa niin mä ostaisin 
ne äkkiä tälle talolle. Ne on niinku se- sen suuruusluokan asioita 


mun mielestä. 


: Joo. (.) Joo. (1.0) 
: Sen takia täs on halunnu reagoida- tai olen reagoinu noin vahvasti. 
: Joo mutta sinänsä tää on must (.) oikeast[aan- 


: [Toi meni itseasias 


tunnepuolelle jo ((nauraa)) 

Mm toi- menettelyhomma niin no mä oon kertonu tästä että (.) nää 
on todellisuudessa (.) näiden tarkotus on toimii Normandian 
maihinnousun savuverhona. 

Niin. 
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42 Esa: Sit sä laitat jonkun numeron vaan sinne niin se oleellinen asia 


43 
44 
45 
46 
47 
48 
49 
50 
51 

52 
53 
54 
55 

56 


57 


Jan: 


Esa: 


Esa: 


on siellä alla oleva ((näyttää elein tekstilaatikon ja hymyilee)) 

Niin teksti, kyllä. 

Et se on niinku tää että mä oon nähny kuinka, esimiehelle josta 
kaikki sanoo että sille ei kukaan anna uskalla ykköstä antaa 

vaikka se on ykkösen arvonen=mä olen nähny ku sille annetaan se 
ykkönen. Koska siellä alla lukee että mitä pitäisi tapahtua 

että esimiestyöni olisi paremmin. Siin lukee alla sitte että (.) 
minusta meidän pitäisi tavata vähintään kerran kuukaudessa 
keskustelemassa minun työtilanteesta ja niin edelleen. Mä en oo 


ainakaan nähny ketään joka ois ottanu herneen nenäänsä sitte siitä. 


: Niin (.) se asia on siinä. 


Siis se ykkönen häviää sinne ja se on- miettii vaan että (.) ei ne 
nyt ihan tolkuttomat noi vaateet oo. Ihan (.) täysjärkisii (.) 
no mutta mä en sinänsä kiinnitä (.) mä ite oon tämmönen mä annan 


ykköstä ja kakkosta. 


58 Jan: Joo no tässä nyt on halunnu pysähtyä tohon oikeesti. 


Analyysissa voisi tarkastella myös sitä, miten sosiaalista ongelmallisuut- 


ta käsitellään. Esimerkissä sosiaalisesti ongelmallisena voitaisiin nähdä 


Janin antama heikko numeerinen arviointi, joka koskee Esan rivillä 16 
avaamaa topiikkia kehittämistyö. Ongelmallisuudesta kertoo esimerkiksi 
psykologinen selonteko (engl. account) olin niin tuohduksissa (rivi 18) ja 


sitä kehystävä arviointi (vähä ehkä liiankin raaka tää ykkönen). Sosiaali- 


sesta ongelmallisuudesta ja tietynlaisen sosiaalisen tunnustuksen 
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tehneen Janin "kasvojen" varjelemisesta kertoo puolestaan Esan (r. 54- 
57) todistelu siitä, että arvioinnin numerot eivät ole niin tärkeitä kuin 
sanallinen arviointi. Tässäkin yhteydessä keskustelussa kiinnostavasti 
psykologisoidaan eli selitetään arvioinnin tapa henkilökohtaisena omi- 
naisuutena (r. 56—57: mä ite oon tämmönen mä annan ykköstä ja kakkosta). 

Esimerkkiä voitaisiin analysoida myös multimodaalisesti eli käyttä- 
mällä videokuvatun aineiston suomia mahdollisuuksia yhdistää keskus- 
telun verbaalin kielen analyysi keskustelijoiden keholliseen vuorovaiku- 
tukseen (esim. Knoblauch, Schnettler & Raab 2006). Tässä artikkelissa 
emme anonymiteettilupauksen vuoksi voi näyttää videotallennetta tai 
kuvakaappauksia tallenteesta, mutta teemme pari esimerkinomaista 
huomiota. Diskurssianalyyttisen tulkinnan kannalta kiintoisaa voisi 
olla esimerkiksi, kuinka papereita käytetään apuna ja välineinä vuoro- 
vaikutuksessa (läpi koko esimerkin puhujat sormeilevat ja vilkuilevat 
heidän välissään pöydällä olevia papereita), kuinka rytmiset eleet esiin- 
tyvät painottamisen ja listan tuottamisen välineinä (r. 27) tai kuinka iko- 
niset eleet voivat ohjata ja täsmentää merkityksiä (r. 43). 

Vaikka useimmissa tapauksissa tutkijalla on ainakin alustavasti tie- 
dossaan joko omaan havaintoon tai johonkin muuhun lähteeseen pe- 
rustuen aihepiiri, jonka kielellistä ja vuorovaikutuksellista rakentumista 
hän aineistosta katsoo, ilmiön tarkempi määrittely syntyy usein analyy- 
sin kautta. Tarkempi pureutuminen kontekstuaaliseen kielenkäyttöön 
täsmentää analyysin kysymyksenasetteluja. Jos esimerkkinämme toi- 
mivaa keskustelukatkelmaa luettaisiin aineistona esimiestyöskentelystä 
ja vallan rakentumisesta keskustelussa, voisi analyysin tekijä paikantaa 
lukuisia eritasoisia kielellisiä (tai multimodaalisia) rakenteita ja niiden 
funktioita, joihin analyysi voisi perustua. Rakenteisiin ja niiden kautta 
funktioihin liittyisi jo aiemmin mainitsemamme tekijyyden esittämi- 
nen ja persoonamuotoisuus. Esimerkin yhteydessä voitaisiin puhua 
johtamis-, tavoite- tai kehityskeskustelutekstilajista (tai sosiaalisesta 
toimintatyypistä), johon liittyisi esimerkiksi keskustelun rakenteelli- 
nen kysymys-vastaus-muotoisuus ja puhujien esiin tuoma ymmärrys 
rooleistaan keskustelussa. Myös sekä verbaaliset että keholliset meta- 
forat ja analogiat ja nimeämisen tavat ovat nekin esimerkissä hyvin 
kiintoisia. 
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4. Yhteenveto 


Diskurssianalyysin dialoginen ja sosiaalinen, vuorovaikutusta korostava 
kielikäsitys ja konstruktionistinen perusta katsoa kieltä todellisuuden 
sosiaalisen rakentumisen välineenä ovat diskurssianalyyttisen metodin 
puitteet. Kielenkäytön mikrotason suhteen diskurssianalyysin metodiset 
ohjenuorat ovat kuitenkin väljät. Fi ole olemassa yhtä tiettyä analyysi- 
välinettä tai esimerkiksi kielenilmiöiden listaa, jonka sisältämät kohdat 
aineistosta analysoimalla saisi tehtyä oikeanlaisen diskurssianalyysin. 

Kielenkäyttöön ja rakenteeseen liittyviä analyysivälineitä kuitenkin 
riittää, ja tässä mielessä diskurssianalyysin metodinen maisema on san- 
gen rikas. Tässä artikkelissa olemme kuvanneet välineistä muutamia ja 
avanneet lyhyesti kahden hyvin erityyppisen esimerkin kautta sitä, millä 
tavoin kielenkäytöstä havainnoitujen kielellisten tai vuorovaikutuksel- 
listen ilmiöiden voi nähdä antavan perusteita sosiaaliselle tulkinnalle. 
Avainkysymys diskurssianalyysissa onkin juuri se, miten kielenkäytöstä 
tehdään sosiaalista tulkintaa. 

Sosiaalinen tulkinta vaatii lingvististä ja nimenomaan diskurssi- 
analyyttistä mielikuvitusta — jolle läheinen käsite voisi olla myös kielitaju 
(ks. Kielitaju kielentutkijan työkaluna tk.). Joka tapauksessa meillä kai- 


killa on valtava kokemuksellinen varanto erilaisia huomioita kielenkäy- 
tön ja kielen rakenteiden toistuvuuksista sekä tulkinnoista, joita olemme 
tehneet ja joista olemme kuulleet liittyen kielenkäytön tapoihin erilai- 
sissa tilanteissa. Kun puhumme diskurssianalyyttisesta mielikuvituk- 
sesta, lainaamme C. Wright Millsin (2015 [1959]) ajatusta sosiologisesta 
mielikuvituksesta, jolla Mills viittasi tietoisuuteen henkilökohtaisen ko- 
kemuksen ja sosiaalisten rakenteiden suhteesta. Vastaavanlainen käsite 
on sosiologinen ambivalenssi (Merton 1976), jolla tarkoitetaan sitä, että 
sosiologi on aina osa sitä, mitä tutkii. Muutettavat muuttaen: diskurssi- 
analyytikko tutkii asioita, jotka ovat hänen omassa kokemuspiirissään, 
ja diskurssianalyytikolla on oltava mielikuvitusta nähdä yhteyksiä kielen- 
käytön ja sosiaalisen toiminnan välillä. Kenttä on laaja, ja monet asiat ja 
ilmiöt voivat olla tutkimuksen kohteena. Itse asiassa diskurssianalyytti- 
nen mielikuvitus yhdistää nimenomaan sosiologisen mielikuvituksen 
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ja lingvistisen mielikuvituksen; diskurssianalyytikko oivaltaa yhteyksia 
sosiaalisten rakenteiden ja kielenkäytön rakenteiden tai niiden käytön 
välillä. 
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VIITTEET 


1 Esimerkki tallaisesta on organisaatiotutkimuksessa virinnyt kiinnostus strategiatyón 
käytäntöihin. Menetelminä on hyödynnetty esimerkiksi kriittistä diskurssianalyysia, 
keskusteluntutkimusta, etnografiaa ja toimintatutkimusta. Yhteinen ilmiö, jota tarkastel- 
laan, on kuitenkin nimenomaan strategiatyö. (Esim. Sorsa, Pälli, Vaara & Peltola 2010.) 
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Mika? 

Laadullinen aineistopohjainen kielentutkimus on aitojen kielenkäyttö- 
aineistojen syvällistä tarkastelua. Vaikka kielellisten aineistojen tallen- 
nuksessa, käsittelyssä ja analyysissa hyödynnetään usein digitaalisia 
apuvälineitä, tutkijan tulkinnalla ja käsityönä tekemällä analyysilla on 
menetelmässä keskeinen asema, sillä laadullisella aineistopohjaisella 
kielentutkimuksella tavoitellaan tutkimuskohteen kokonaisvaltaista ym- 
märtämistä. 

Katso myös: 

Johdannon luku 1. Tutkimuksen käytäntö 

Luku 9 Korpusaineistot 

Luku 10 Määrällinen korpuslingvistiikka 


Luku 11 Historiallinen korpuslingvistiikka 
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1. Johdanto: mitä on laadullinen 
aineistopohjainen kielentutkimus? 


Suomalaisessa kielentutkimuksessa on hyvin tavallista, että kielellisistä 
ilmiöistä hankitaan tietoa tarkastelemalla tutkimuskohdetta laadulli- 
sesti aidoissa kielenkäyttöaineistoissa. Laadullista aineistopohjaista 
kielentutkimusta tekevää opiskelijaa tai nuorta tutkijaa saattaa kui- 
tenkin hämmentää kysymys tutkimuksen menetelmästä. Jos käytös- 
sä ei ole jotakin vakiintunutta, erikseen nimettyä menetelmää, kuten 
keskustelunanalyysia, tarkoittaako tämä sitä, että tutkimuksessa ei ole 
mitään menetelmää? 

Ajatus siitä, että tieteellisessä tutkimuksessa ei noudatettaisi mi- 
tään systemaattista menettelytapaa, jolla aineistosta hankitaan tietoa, 
on loogisesti ja eettisesti mahdoton. Väistämättä on niin, että aineistoa 
tarkastellessaan tutkija jäsentää ja järjestää tutkimuskohdetta erilaisiin 
luokkiin havaintojensa ja ennakkotietojensa perusteella. Tästä mene- 
telmästä käytetään kielentutkimuksessa toisinaan nimitystä perinteinen 
lingvistinen analyysi. Käytännössä järjestämisen apuna voidaan käyttää 
lähes mitä tahansa systemaattista menettelytapaa, esimerkiksi aineisto- 
esimerkkejä sisältäviä pahvilappuja, jotka järjestetään kenkälaatikkoon 
tietyn periaatteen mukaisesti, tai värikynämenetelmää, jossa samaan 
luokkaan kuuluvat tapaukset merkitään yhtenäisellä värikoodilla. Nykyi- 
sin aineiston järjestämisessä hyödynnetään yhä useammin digitaalisia 
apuvälineitä. Riippumatta luokittelun käytännön toteutuksesta aineiston 
järjestämisen taustalla olevat periaatteet on tärkeä tunnistaa ja kuvata 
tutkimuksen menetelmäosiossa. 

Keskitymme tässä artikkelissa kuvaamaan sellaista laadullista aineis- 
topohjaista kielentutkimusta, joka kohdistuu digitaalisista aineistoista 
poimimalla koostettuun tutkimusaineistoon ja joka toteutetaan tieto- 
kantaohjelman avulla." Tutkimusasetelmasta johtuen käytämme tässä 
artikkelissa selkeyden vuoksi sanaa tutkimusaineisto tarkoittamaan tutki- 
jan itselleen koostamaa esiintymien joukkoa, jonka perusteella tutkimus 
tehdään. Tässä artikkelissa esiteltyjä periaatteita voidaan kuitenkin hyvin 
soveltaa kaikenlaiseen aineistopohjaiseen laadulliseen analyysiin. 
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Laadullisella aineistopohjaisella kielentutkimuksella ymmärrämme 
tässä aitojen kielenkäyttöaineistojen syvällistä tarkastelua, jonka tavoit- 
teena on tutkimuskohteen kokonaisvaltainen ymmärtäminen (ks. myös 
Hasko 2012). Digitaalisessa muodossa olevia aineistoja on mahdollista 
tallentaa, käsitellä ja analysoida tietokoneavusteisesti. Kielentutkimuk- 
sen materiaalina ei kuitenkaan tarvitse käyttää pelkästään valmiiksi 
annotoituja massa-aineistoja, joita on saatavilla eri kielille (ks. Korpus- 
aineistot tässä kirjassa), vaan tutkijalla on vapaus koota oma tutkimus- 
aineistonsa ja käyttää myös ei-digitaalisessa muodossa olevaa mate- 


riaalia sen koostamiseen. Monista hyvistä puolistaan huolimatta valmiit 
massa-aineistot eivät pysty vastaamaan kaikkiin kielentutkimuksen tar- 
peisiin. Laadulliselle aineistopohjaiselle kielentutkimukselle onkin omi- 
naista määrällistä korpustutkimusta pienempien tutkimusaineistojen 
käyttö (ks. Määrällinen korpuslingvistiikka tk.). Pienemmän tutkimus- 
aineiston käyttö mahdollistaa myös tutkimuskohteen yksityiskohtaisem- 


man tarkastelun, kun tutkijan on mahdollista tutustua erikseen jopa 
jokaiseen yksittäiseen aineistoesiintymään. Vaikka laadullisen ja mää- 
rällisen tutkimuksen tutkimuskysymykset ja tavoitteet ovatkin erilaisia, 
niillä on kuitenkin paljon yhteistä ja ne täydentävät usein toisiaan. Pa- 
laamme tähän artikkelin loppupuolella (ks. myös Johdannon luku 4 tk.). 

Laadullisen aineistopohjaisen kielentutkimuksen taustalla on usein 


käyttöpohjainen kielikäsitys, jonka mukaan kielellinen merkitys ja kie- 
len rakenne perustuvat kielen käyttöön autenttisissa viestintätilanteissa. 
Esimerkiksi kahden toisilleen lähimerkityksisen sanan, kuten suomen 
asti ja saakka, eroja voidaan pyrkiä selvittämään kontekstin perusteella 
(Päiviö 2007). Usein tämän ajatuksen kohdalla viitataan Firthin (1968, 
179) kuuluisiin sanoihin ”you shall know the meaning of a word by 
the company it keeps”, mutta jo Frege (1884, 116) esitti teoksessaan 
Die Grundlagen der Arithmetik vastaavia ajatuksia: ”Wir stellten nur 
den Grundsatz auf, dass die Bedeutung eines Wortes nicht vereinzelt, 
sondern im Zusammenhange eines Satzes zu erklären sei” ("Sanan 
merkitystä ei pidä tarkastella yksin, vaan lauseyhteydessa’). Konteks- 
tin tarkastelussa huomiota voidaan kiinnittää esimerkiksi tutkittavien 
sanojen kanssa samassa tekstiyhteydessä esiintyviin ilmauksiin ja ra- 
kenteisiin, ympäröivän tekstin muodostamaan kokonaisuuteen sekä 
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tekstinulkoisiin, maailmantietoon perustuviin seikkoihin (ks. esimerkki 
1). Laadullisen aineistopohjaisen kielentutkimuksen menetelmät voi- 
vat kyllä soveltua myös sellaiseen sanastontutkimukseen, jossa sanojen 
käyttöä ei oteta huomioon, kuten myöhemmin käyttämästämme esi- 
merkistä 2 nähdään. Tällöin tutkittavia sanoja tarkastellaan tutkimus- 
aineistoksi määritellyn joukon jäseninä, ja tutkimuskysymykset ja tut- 
kimuksen tavoitteet määritellään toisin kuin perustapauksissa, joissa 
käyttökonteksti on mukana. 

Laadullinen aineistopohjainen kielentutkimus soveltuu erityisen hy- 
vin monitahoisten ilmiöiden syvälliseen ja kokonaisvaltaiseen tarkas- 
teluun. Se on omiaan myös aiemmin vähän tutkittujen ilmiöiden kar- 
toituksessa, sillä se mahdollistaa tutkimusaineiston yksityiskohtaisen 
käsittelyn sekä luokittelun rakentamisen ja tutkimuskysymysten tarken- 
tamisen sen perusteella, mitä tutkimusaineisto paljastaa. Esittelemme 
tässä artikkelissa laadullista aineistopohjaista kielentutkimusta tieto- 
kanta- tai taulukkotyöskentelyn näkökulmasta, sillä kokemuksemme 
mukaan tällainen työskentelytapa helpottaa tutkimusaineiston käsittelyä 
ja lisää analyysin systemaattisuutta. Ennen laadullisen tutkimuksen pro- 
sessien kuvaukseen siirtymistä avaamme kuitenkin vielä lisää laadulli- 
sen aineistopohjaisen kielentutkimuksen historiallista taustaa. 


Mihin? 


Laadullinen aineistopohjainen kielentutkimus soveltuu kaikenlaisten 
(kooltaan kohtuullisten) tutkimusaineistojen tarkasteluun. Sen vahvuu- 
tena on taipuminen monitahoisten ilmiöiden tutkimiseen silloin, kun 
ilmiöstä halutaan saada syvällistä ja kokonaisvaltaista tietoa. Tietokanta- 
tai taulukkotyöskentely helpottaa tutkimusaineiston käsittelyä ja lisää 
analyysin systemaattisuutta. 
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2. Historiallista taustaa 


Kielen kuvaaminen perustuu aina jollakin tavoin autenttiseen aineis- 
toon. Abstrakteimmillaan "aineisto" on yhtä kuin (äidinkielisen) tutki- 
jan taju kielestä (ks. Kielitaju kielentutkijan työkaluna tk.), mutta taval- 
lisempaa on, että aineisto on kerätty ja talletettu jossakin muodossa. 


Aineistojen muodot ovat kehittyneet käsin tehdyistä muistiinpanoista 
ja keräelmistä ääni- ja kuvatallenteisiin. Aiemmin fyysisessä muodossa 
tallennettuja kokoelmia on digitoitu ja digitoidaan edelleen aineistojen 
saatavuuden parantamiseksi. Laadullisen aineistopohjaisen kielentutki- 
muksen taustalla on ajatus siitä, että autenttisessa tilanteessa käytetty 
kieli antaa parhaat edellytykset tutkia valittua ilmiötä. Tällaisella aineis- 
tolla ajatellaan siis saatavan mahdollisimman hyvin todellisuutta vas- 
taava kuva, jota aineiston tuottaja ei ole tietoisesti tai tahattomasti muo- 
vannut tutkimuksen tuloksiin vaikuttavalla tavalla. Kärjistetysti tämän 
ajatuksen voi ilmaista sanomalla, että aineisto tarjoaa autenttisen kuvan 
tutkijan tarkasteltavaksi, eriteltäväksi ja tulkittavaksi. 

Suomen kielen tutkimuksessa laadullisella aineistopohjaisella tut- 
kimuksella on pitkät perinteet, ovathan tieteenalan juuret olennaisella 
tavalla 1800-luvulla virinneessä kiinnostuksessa kansanrunouteen ja 
erityisesti itäisten murteiden edustamaan ”aitoon” ja ”turmeltumatto- 
maan” kieleen? (esim. Häkkinen 1994, 441-442; Hovdhaugen, Karlsson, 
Henriksen & Sigurd 2000, 245-246; Häkkinen 2008, 89—91). Tuol- 
loin aineiston kerääminen oli välttämätöntä, koska kokonaisvaltaista 
tietoa esimerkiksi murteiden ominaislaadusta ei yksinkertaisesti ollut 
(Häkkinen 2008, 101); aineistoja kerättiin kielen dokumentoimisek- 
si. Myöhemmin sanasto-, nimistö- ja kielennäytekokoelmia on kerätty 
eri yliopistojen suomen kielen tutkijoiden ja opiskelijoiden voimin, ja 
kenttätyö (esimerkiksi nimestys eli paikannimien keruu) kuului pitkään 
suomen kielen yliopisto-opintojen pakolliseen sisältöön (esim. Lyyti- 
käinen 1984; Lyytikäinen & Yli-Paavola 2010; Suutari 2010). Kenttä- 
työtä tehdään edelleen, mutta nykyisin työ on useimmiten johonkin 
tutkimushankkeeseen sitoutunutta (2000-luvulla esimerkiksi Koti- 
maisten kielten keskuksen murteenseuruuhanke ja Turun yliopiston 
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Suomenkielisten arkikeskustelujen morfosyntaktinen tietokanta Arki- 
syn‘; ks. myös Karttunen & Rouhikoski 2010). 

Pitkään oli tyypillistä, että tutkijat keräsivät omat aineistonsa, joihin 
tutkimuksen saattoi perustaa (Häkkinen 2008, esim. 98-108, 117, 145). 
Kun aineistojen keruuta alettiin toteuttaa organisoidummin, syntyi myös 
kollektiiviseen käyttöön tarkoitettuja aineistoja, joita opiskelijat ja tutkijat 
voivat käyttää opinnäytetöihin ja muihin tutkimuksiin (korpuksista ks. 
Korpusaineistot tk.). Käsityksen aineistopohjaisen kielentutkimuksen 
aihepiirien kirjosta voi saada esimerkiksi Turun yliopiston suomen kie- 


len ja suomalais-ugrilaisen kielentutkimuksen oppiaineista vuoden 1947 
jälkeen valmistuneiden tutkielmien pro gradu -tietokannasta hakemalla 
vaikkapa aihepiirit ”sanastontutkimus” ja "murretutkimus"5 (ks. myös 
Leino, Majapuro & Kristiansson-Seppälä 1984; Lyytikäinen 1984, 450). 
Suomen kielen tutkimuksen synty yhdistyi siis kielen dokumentointiin, 
ja tällä voi ajatella olleen vaikutusta siihen, miten keskeiseksi laadullinen 
aineistopohjainen tutkimus fennistiikan alalla muodostui. Perinteistä 
fennististä kielentutkimuksen tavoitetta onkin kuvattu luonnehdinnalla 
”laaja, hyvin järjestetty aineisto puhuu puolestaan” (Ravila 1967, 35; ks. 
myös Karlsson 1975). Luonnehdinta heijastaa tutkimuksessa vallinnutta 
aineistouskoa ja arvostusta, jota aineiston parissa työskentelyä kohtaan tun- 
nettiin. Näkemykseen saattoi liittyä myös käsitys siitä, että tutkimuksessa 
vastaan tulevat ongelmat voidaan poistaa hankkimalla ja käsittelemällä lisää 
aineistoa. Myöhemmin luonnehdintaan on suhtauduttu myös väheksyvästi: 
pelkkä aineiston kuvaaminen saati sen laajuus ei itsessään vie tutkimusta 
eteenpäin, vaan kiinnostavaa on vasta se, mitä aineistosta voidaan päätellä. 
Laadullisen aineistopohjaisen kielentutkimuksen menetelmän kuvaus voi 
kuitenkin hyödyntää perinteistä luonnehdintaa, ja tämä on lähtökohtamme 
seuraavassa jaksossa, jossa tarkastellaan menetelmää konkreettisemmin. 
On syytä muistaa, että tutkijan aikaisemmat tiedot (kielitaju, lingvistinen 
koulutus jne.) ovat aina jossakin määrin hänen tekemiensä valintojen 
taustalla: tutkimusaiheen, tutkimuskysymysten ja aineiston valinnassa, 
tutkimusaineiston koostumuksen arvioinnissa, esiintymien analyysissa ja 
päätelmien tekemisessä (ks. Kielitaju kielentutkijan työkaluna; Johdannon 
luku 4 tk.). Seuraava menetelmän kuvaus keskittyy kuitenkin siihen, miten 
toimia aineiston kanssa laadullisen kielentutkimuksen eri vaiheissa. 
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Mita tutkitaan? 

e kieliopin tutkimus 

e sanaston ja terminologian tutkimus 
e kielen oppimisen tutkimus 

e kielihistoriallinen tutkimus jne. 


3. Miten laadullista aineistopohjaista 
kielentutkimusta tehdään? 


3.1. ”Laaja”: tutkimusaineiston hankkiminen ja koko 


Ensimmäiseksi laadullista aineistopohjaista kielentutkimusta tekevän 
tutkijan on ratkaistava kysymys käytettävän tutkimusaineiston koos- 
tumuksesta ja laajuudesta. Tähän ei tietenkään ole yksiselitteistä vas- 
tausta, vaan vastaus riippuu tutkimuksen laajuudesta, tutkittavasta ai- 
heesta ja myös saatavana olevista aineistoista. Jos haluaa tutkia jotakin 
ilmiötä vanhassa kirjakielessä, aineiston valinta saattaa olla hyvinkin 
suoraviivaista, jos aineistoja on niukasti ja niiden väliset genre-erot ovat 
pieniä. Näin on esimerkiksi vanhimmissa suomenkielisissä teksteis- 
sä, jotka kaikki edustavat uskonnollista käännöskirjallisuutta. Suurissa 
eurooppalaislähtöisissä kielissä tilanne voi tältäkin osin olla erilainen, 
koska kirjoitetun kielen historia on pidempi ja saatavana on eri teks- 
tilajeja edustavia aineistoja (ks. Historiallinen korpuslingvistiikka tk.). 


Nykykielisen ilmiön tutkijan sen sijaan on tehtävä valintoja esimer- 
kiksi yleiskielisten aineistojen ja murre- tai keskusteluaineistojen vä- 
lillä sekä kirjoitetun ja puhutun kielen aineistojen välillä. Kirjoitetun 
yleiskielen ja puhutun murteen tai arkikeskustelun välillä on luonnol- 
linen yhteys, mutta saatavana on myös puhuttua yleiskieltä edustavaa 
aineistoa (esimerkiksi radiopuhe, esitelmä- ja väitöstilaisuudet, puheet) 
ja kirjoitettua murretta (murteella kirjoitettu kirjallisuus), ja tutkimus 
voi kohdistua myös siihen, miten keskustelua kirjoitetaan (sähköinen 
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vuorovaikutus, kaunokirjallisuuden dialogit, haastattelujen käyttö kir- 
joitetussa mediassa jne.). Tutkijan on myös päätettävä, haluaako hän 
vertailla ilmiön esiintymistä erilaisissa aineistoissa: miltä kirjoitetussa 
nyky-yleiskielessä esiintyvä ilmiö näyttää vaikkapa murteissa tai varhai- 
semmassa kirjakielessä? Useamman aineistotyypin käyttäminen ei auto- 
maattisesti tarkoita tutkimusaineiston laajuuden kasvattamista vaan en- 
nemminkin sitä, että tutkimusaineiston koostumus harkitaan tarkasti. 

Käytettävän tutkimusaineiston laajuuteen vaikuttaa myös se, millai- 
nen tutkittava aihe on. Onko ilmiö kielessä yleinen vai harvinainen? 
Onko tutkittavana yksi, yhtenäinen rakennetyyppi vai joukko toisiinsa 
jollakin tavoin kiinnittyviä rakenteita, esimerkiksi yksi postpositio vai 
postpositioiden ryhmä? Harvinaisen ilmiön tai yksittäisen rakenteen 
esiintymät saattaa olla mahdollista poimia tutkittavaksi kattavasti, mutta 
yleisestä ilmiöstä tai rakenteiden joukosta on poimittava otos, jolloin 
pitää valita, kuinka otos koostetaan (ks. Korpusaineistot tk.). Toisaalta 


ilmiö voi olla myös niin harvinainen, että sen esiintymiä ei löydä suuris- 
takaan aineistoista, jolloin paras vaihtoehto tutkimusmenetelmäksi on 


introspektio (ks. Kielitaju kielentutkijan työkaluna tk.) tai kyselymene- 
telmän käyttö (ks. Kysely tk.).° 

Käytettävän tutkimusaineiston kokoon vaikuttaa sekin, onko tutki- 
muksen kohteena oleva ilmiö poimittavissa jostakin sähköisestä aineis- 
tosta suoran aineistohaun avulla. Jos aineisto on morfologisesti ja syn- 
taktisesti koodattu (kuten esimerkiksi Lauseopin arkiston? materiaali 
on), on haku mahdollista kohdistaa varsin tarkastikin määriteltyyn kieli- 
opilliseen kategoriaan. Tällaisessa tilanteessa on hyödyllistä tutustua 
aineiston koodaamisessa noudatettuihin periaatteisiin, koska tutkijan 
tulkinta ilmiöstä voi olla erilainen kuin aineiston koostajien (esim. Ikola 
1985 Lauseopin arkistosta; Inaba 2007 Mikael Agricolan teosten morfo- 
syntaktisesta tietokannasta). Jos tutkimuksen kohteena on tietty sana tai 
tietyt sanat, ne on mahdollista hakea ainakin yleiskielisistä sähköisistä 
aineistoista merkkijonohaun avulla. Esimerkiksi Lauseopin arkiston ai- 
neisto on tätä nykyä myös hakusanoitettu, eli tietyn sanan esiintymät 
voi hakea yleiskielisen hakusanan avulla riippumatta siitä, mikä sanan 
äänteellinen asu kulloinkin on (esim. hakusanalla tehdä saa esiin mm. 
sanat tehrä ja tehä). Vanhempia kielimuotoja ja muita kuin yleiskieltä 
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edustavista (hakusanoittamattomista) aineistoistakin merkkijonohakuja 
voi tehdä, mutta silloin tulee huomata, että sanojen kirjoitusasut voivat 
olla moninaiset. Toisaalta vaikkapa metaforien aineistopohjainen tutki- 
mus voidaan toteuttaa menetelmiä yhdistämällä: tutkija hankkii ensin 
käsityksen olemassa olevista metaforista tekstejä systemaattisesti läpi 
lukemalla, ja tämän vaiheen perusteella koostetaan sanajoukko, jonka 
esiintymät voidaan hakea korpuksesta automaattisesti (Tissari 2017). 
Hyvä esimerkki yksilöllisen tutkimusaineiston kokoamisesta ovat ns. 
imitatiivit, joiden hakeminen aitoa kielenkäyttöä edustavasta mate- 
riaalista vaatii tutkijan omaa tarkkaavaisuutta ja käsityötä (Jääskeläinen 
2013). Myös vanhan kirjakielen tutkimuksessa tekstien läpi lukemista 
pidetään usein tärkeänä tutkimusaineiston keruumenetelmänä (koodat- 
tujen) digitaalisten aineistojen olemassaolosta huolimatta (esim. Num- 
mila 2012). 

Hakipa tutkimusaineistonsa millaisesta lähteestä ja millaisella kei- 
nolla tahansa, on poiminnat aina käytävä huolellisesti läpi sen varmista- 
miseksi, että ne todella kuuluvat tutkimuksen alaan. On tyypillistä, että 
hakutuloksen joukossa on roskaa, joka on siivottava käsin. Tutkimus- 
aineiston käsittelyä ei voi jatkaa, ennen kuin siivous on tehty. 

Laadullisessa aineistopohjaisessa kielentutkimuksessa analyysi teh- 
dään pääosin käsityönä, ja tämän takia tutkimusaineiston koko on pi- 
dettävä kohtuullisena. On mahdotonta antaa yksiselitteisiä ohjeita siitä, 
minkä kokoinen aineisto on riittävä, koska se riippuu sekä tutkimus- 
aiheesta että tutkimuksen laajuudesta. Tutkimuksen kuluessa voi luon- 
nollisesti tulla vastaan tilanteita, joissa koostetun tutkimusaineiston 
supistaminen tai laajentaminen on paikallaan. Aineistoesiintymiä ana- 
lysoidessaan voi jossakin vaiheessa havaita, että niukempi esiintymä- 
joukko riittää tutkimuskysymyksiin vastaamiseen. Toisaalta jos esimer- 
kiksi selvitetään aiemmin kuvaamattoman kielen rakennetta, on aivan 
mahdollista, että valittu tai käytettävissä oleva tutkimusaineisto ei si- 
sälläkään riittävästi tietoa jostakin ilmiöstä, vaan materiaalia on kuvan 


täydentämiseksi hankittava lisää (ks. Kielten dokumentointi ja kieliopin 


kuvaus tk.). 
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3.2. ”Hyvin järjestetty”: tutkimusaineiston käsittely 


Aineiston järjestäminen tarkoittaa tutkimusaineistoon poimittujen 
esiintymien luokittelua ja koodaamista esiintymien ominaisuuksien 
perusteella. Koodaamisella? tarkoitamme tässä sitä, että tutkimusaineis- 
ton esiintymälle annetaan joukko sen ominaisuuksista kertovia nimi- 
lappuja sen mukaan, mitkä asiat esiintymässä kiinnostavat tutkijaa. 
Kaikkien menetelmien käytössä systemaattisuus on alku ja juuri, myös 
laadullisessa aineistopohjaisessa tutkimuksessa. On päätettävä, millaisia 
seikkoja esiintymistä koodataan ja miten, ja toteutettava koodaaminen 
järjestelmällisesti jokaisen esiintymän kohdalla. Tyypillisesti tutkitta- 
vaksi poimittuihin esiintymiin liitetään ainakin erilaisia metatietoja 
esiintymän alkuperäisestä lähteestä (esimerkiksi sanomalehtiaineiston 
tapauksessa ainakin julkaisupäivä, otsikko, lehden nimi, osasto jne.). 
Lisäksi voidaan koodata tutkimuskohteesta riippuen erilaisia lingvis- 
tisiä tietoja, kuten morfologian, syntaksin, semantiikan, pragmatiikan 
tai diskurssin tason merkintöjä. Nämä tiedot ovat kielikohtaisia, ja nii- 
den koodaaminen edellyttää tutkittavan kielen rakenteen tuntemusta ja 
asianmukaisten lähteiden, esimerkiksi kielioppien, hyödyntämistä. Toi- 
mivan yksittäisestä kielestä riippumattoman yleiskuvauksen kielellisen 
rakenteen analyysista tarjoavat Payne (1997) ja Dixon (2010). 
Esiintymän morfologisten ominaisuuksien analyysissa otetaan huo- 
mioon tutkittavan kielen taivutuskategoriat, kuten nomineilla luku ja sija. 
Sellaisissa kielissä, joissa on tämän tyyppistä taivutusta, lauseen syntak- 
tinen analyysi on riippuvainen sanojen morfologisista ominaisuuksis- 
ta, koska lauseenjäsenyys määräytyy morfologisen muodon perusteella 
(esimerkiksi suomessa objektin sijat ovat nominatiivi, partitiivi, yksikön 
genetiivi ja persoonapronomineilla akkusatiivi eikä muussa taivutusmuo- 
dossa oleva sana voi olla objekti). Lauseen syntaktisessa analyysissa on 
morfologisen muodon lisäksi katsottava lauseen kokonaisuutta ja sano- 
jen suhteita toisiinsa. Lauseessa voi nimittäin olla useampia samassa 
taivutusmuodossa olevia sanoja, jolloin kokonaisuus ratkaisee, minä lau- 
seenjäsenenä sana toimii. Suomen lauseessa Pallo on pyöreä molemmat 
nominit ovat yksikön nominatiivissa, mutta kokonaisuuden perusteella 
on selvää, että esineeseen viittaava substantiivi pallo toimii subjektina ja 
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ominaisuutta ilmaiseva adjektiivi pyöreä predikatiivina. Sanaluokka on- 
kin perustana sanatason semanttiselle analyysille, jota voidaan tarkentaa 
tutkimuskohteen mukaan (vaikkapa jakamalla substantiivien ilmaisemat 
oliot edelleen elollisiin ja elottomiin tai ihmisiin, muihin elollisiin, esinei- 
siin, rakennuksiin tms.). Lausetason semanttisessa analyysissa voi pohtia 
niin sanottuja semanttisia rooleja: esimerkiksi lauseen subjekti on tyypil- 
lisesti toiminnallinen agentti, objekti toiminnan kokeva kohde (patientti) 
ja adverbiaali jollakin tavoin toimintaa kehystävä taustaelementti, kuten 
sijainti (lokaatio; Poni [agentti] veti kärryt [patientti] pihalle [lokaatio]). 

Tarkastellaan seuraavaksi yhtä tapaa koodata lauseen Haahka on mus- 
ta vatsan alta morfologisia, syntaktisia ja semanttisia ominaisuuksia. 


Haahka on musta vatsan alta. 
sanaluokka | substantiivi | verbi adjektiivi substantiivi | postpositio 
morfologia | yks. nom. akt. ind. pr. | yks. nom. yks. gen. yks. abl. 

y. 3- P- 
syntaksi subjekti predikaatti predikatiivi adverbiaali 
semantiikka | elollinen olla-verbi/ väri elollinen/ osa/ 

kopula osa kokonaisuus 


Harvassa tutkimuksessa tarvitaan näin perusteellista koodaamista tut- 
kimusaineiston esiintymistä. Tärkeä osa tutkimusaineiston käsittelyä 
onkin koodaamisen pohtiminen suhteessa tutkimuskysymyksiin. Mitkä 
asiat ilmiössä kiinnostavat? Millaisten asioiden pohjalta niitä olisi mah- 
dollista selvittää? Tutkimusaineiston käsittelyperiaatteiden huolellinen 
pohtiminen voi viedä eteenpäin paitsi konkreettista aineistotyötä myös 
tutkijan käsitystä tutkittavasta aiheesta ja tutkimuksen rakenteesta. Se, 
miten tutkimusaineistoa käsittelee, voi heijastua varsin suoraan siinä, 
miten tutkimuksesta raportoi tekstinä. Se voi myös auttaa ymmärtä- 
mään tutkimuksen teoriasta kumpuavia käsitteitä, kun pohtii, mitkä 
niistä olisivat tutkimusaineiston koodaamiseen soveltuvia (ks. muut- 
tujan ja kiintopisteen koodaaminen esimerkissä 1). Näin teoria myös 
suuntaa analyysia tarjoamalla käsitteitä tutkittavan ilmiön analysoin- 
tiin. On tutkijan valinta, kuinka vahvaa käytetyn teoriataustan ohjaus 
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aineiston käsittelyssä on. Täysin teoriasta vapaata se ei ole koskaan. 

Laadullisen aineistopohjaisen kielentutkimuksen keskeinen tausta- 
oletus on, että aitoon kielenkäyttöön perustuva aineisto on arvokasta 
ja jopa välttämätöntä kielentutkimukselle. Tästä seuraa myös se, että 
tutkittavat ilmiöt ovat sidoksissa toisiinsa. Kielentutkimuksen tärkeim- 
piä tavoitteita onkin selvittää, millaisia ilmiöiden (esimerkiksi morfo- 
syntaktisten ominaisuuksien) väliset suhteet ovat: jos tarkastellaan il- 
miötä X (esimerkiksi jotakin postpositiota), mitä säännöllisiä seuralaisia 
sillä on (esimerkiksi millaisten verbien kanssa ko. postpositio viihtyy)? 
Myöhemmässä vaiheessa päästään myös pohtimaan, miksi eri elementit 
viihtyvät yhdessä ja mitä tällaisesta kumppanuudesta seuraa. Tutkimus- 
aineiston käsittelyssä onkin aina kiinnitettävä jossain määrin huomiota 
myös ilmiön esiintymisympäristöön ja koodattava jonkin verran myös 
kielellisen kontekstin ominaisuuksia. 

Edeltävä esimerkki on mukaelma esiintymästä Ojutkankaan (esim. 
2008a) käyttämässä tutkimusaineistossa, jonka avulla tutkitaan suomen 
paikkaa ilmaisevien postpositioiden ja adverbien käyttöä ja merkitys- 
tä. Tutkimusaineistoon kuuluu murreaineistoa (Lauseopin arkistosta), 
vanhaa ja 1800-luvun kirjakieltä (Kotimaisten kielten keskuksen van- 
han kirjasuomen ja varhaisnykysuomen korpuksista) ja nyky-yleiskiel- 
tä (mm. Kielipankista). Tutkimuksessa koodaus toteutuu seuraavaan 


tapaan: 

Haahka on musta vatsan alta. 
sanaluokka: substantiivi | postpositio 
morfologia: yks. gen. yks. abl. 
syntaksi: subjekti 
semantiik- elollinen olla-verbi elollinen/ osa/ 
ka: osa kokonaisuus 

muuttuja kiintopiste 


Tutkimusaineiston koodaamisessa on suositeltavaa käyttää jotakin tieto- 
kanta- tai taulukkolaskentaohjelmaa. Siitä on etua monessa suhteessa. 
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Ensinnäkin tietokanta- tai taulukkomuoto auttaa koodaamisen syste- 
maattisuudessa, kun jokaisella tutkimusaineiston esiintymällä on oma 
paikkansa, jossa se odottaa nimilappujensa täyttämistä. Toiseksi sähköi- 
sessä muodossa oleva tutkimusaineisto pysyy tallessa ja järjestyksessä, 
on kopioitavissa ja kulkee kevyesti paikasta toiseen tarpeen mukaan, 
kaikkein kevyimmin pilveen tallennettuna. Siihen on myös helppo tehdä 
hakuja, mikä auttaa löytämään tarkastelun kohteena olevat tapaukset 
nopeasti. Kolmanneksi tietokanta- tai taulukkomuoto voi auttaa mer- 
kittävästi ilmiön ominaisuuksien välisten suhteiden hahmottamisessa, 
toisin sanoen tutkimustulosten saavuttamisessa (tähän palaamme seu- 
raavassa jaksossa). Käytännössä sähköinen muoto rakennetaan siten, 
että kukin aineistoesiintymä sijoitetaan omalle rivilleen ja esiintymän 
lähdetiedoille ja kullekin esiintymästä analysoitavalla seikalle varataan 
taulukosta oma sarake. Sarakkeet täytetään systemaattisesti tutkijan va- 
litsemilla yksiselitteisillä koodeilla. Oheinen esimerkki havainnollistaa 
edellä käytettyä esimerkkiä hyödyntäen, millaisia tietoja tietokanta tai 
taulukko voi sisältää. 


Esimerkki 1 koodauksesta: 


Numero |Grammi | Esimerkki Lähde Käsite | Käsite 2 Sija- 
muoto 
4 AL VL Niin koiranen- o/ LA/murre | paikka | osa- E-abl 
**valkone *seljäm LUVIA kokonai- 
<<päält>> ja/ ja **musta/ | 0011 227 suus 


*vatan- <<alt>> ja 
**naaranen- o 
*semmone/ 
*ruskia**harma.// 


1 2 3 4 5 6 7 
Syntakti- | Verbi | Muuttuja | KP: KP: semantti- | Sana- Muut Huomau- 
nen rooli morfo- nen luokka jarjestys | grammit |tuksia 

logia 

postpos olla | elollinen, | leks-gen | elollinen/osa paalta haahka 

sb 

8 9 10 11 12 13 14 15 
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1) Esiintymän juokseva numero tulee suoraan tietokantaohjelmasta. Se 
on muuttumaton tieto, joka varmistaa, että tietue (eli yhden rivin tiedot) 
pysyy koossa. 


2) Tietokannassa on useiden eri grammien eli adpositioitten (pre- ja 
postpositioitten) ja adverbien esiintymiä (grammi on kätevä suomen kie- 
liopin tutkimukseen vakiintunut kattonimitys sanoille, jotka toimivat 
sekä adpositioina että adverbeina; termin on alkuaan ottanut käyttöön 
Svorou [1993]). Suomen grammeilla on useimmiten vähintään kolme 
taivutusmuotoa, ja tähän sarakkeeseen kirjatun koodin avulla on helppo 
hakea kaikki grammin muodot (tässä tapauksessa alla, alta ja alle eri 
murrevariantteineen). 


3) Grammin esiintymävirke (tarvittaessa laajemmankin kontekstin kera). 
Tarkastelun kohteena oleva elementti nousee tekstistä esiin kaksinker- 
taisten kulmasulkeiden sisällä. Jos esiintymävirkkeessä on useita gram- 
meja, virke toistuu tietokannassa. Tämä esiintymä siis on tietokannassa 
kahdesti, AL- ja PÄÄ-koodilla. Esiintymän alussa ovat puhujan nimi- 
kirjaimet erottamassa haastattelijan ja haastateltavan puhetta toisistaan. 


4) Esiintymän lähdetiedot. Tässä LA tarkoittaa Lauseopin arkistoa ja Lu- 
via pitäjää. oorr on Luvian koodi Lauseopin arkistossa ja 227 virkkeen 
numero Luvian näytteen tekstissä. Lähdetietojen perusteella voisi tässä 
tehdä päätelmiä siitä, esiintyykö grammin jokin käyttötapa vain tietyllä 
murrealueella. Jos aineistona olisi eri tekstilajeja, lähdetiedon perusteel- 
la voisi tehdä vastaavasti havaintoja tekstilajien välisistä eroista tarkas- 
teltavan ilmiön osalta. 


5 ja 6) Esiintymän ensisijainen merkitys ja mahdollinen merkityksen 
tarkennus. Tämän avulla on mahdollista tehdä esiintymien siivouksen 
loppusilaus, esimerkiksi karsia pois tapaukset, joissa grammin merkitys 
ei olekaan sijaintia ilmaiseva. Näiden tietojen perusteella saa luonnolli- 
sesti esiin myös merkitysryhmiä osana tutkimustuloksia. 
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7) Grammin morfologinen muoto. Tässä E tarkoittaa erosijaa; tämän 
koodin avulla on helppo poimia kootusti elatiivi-, ablatiivi- ja partitiivi- 
muotoiset grammit, jos tarpeen. Abl tarkoittaa ablatiivia. (Näiden tieto- 
jen käytöstä tutkimuksessa on esimerkki luvussa 3.3.) 


8) Grammin syntaktinen rooli postpositiona (yhdessä genetiivisijaisen 
täydennyksen kanssa) tai adverbina (yhdessä paikallissijaisen seuralai- 
sen kanssa tai ilman seuralaista). Grammin syntaktinen rooli kytkeytyy 
suoraan kiintopisteen ilmaisemiseen (ks. kohta 11). 


9) Verbin semanttinen luokka. Koodaus on tehty Anneli Pajusen suo- 
men kielen verbejä käsittelevän Argumenttirakenne-teoksen (2001) luo- 
kitusta soveltaen. Kun tutkii sanojen käyttöä, verbin tyyppi (esim. liike- 
verbi, antamisverbi) on usein äärettömän hyödyllinen tieto. Se auttaa 
usein ratkaisevasti hahmottamaan esiintymien merkitystä ja esiintymille 
mahdollisia konstruktioita. Jos tutkittava aineisto on lausemuodossa, 
verbi kannattaa koodata aina. 


10) Muuttuja on kognitiivisen kielentutkimuksen käsite, joka tarkoittaa 
huomion ensisijaisena kohteena olevaa osallistujaa. Merkityksen analyysis- 
sa se on siis varsin keskeinen koodattava. Tähän sarakkeeseen koodataan 
grammin muuttujan semanttinen luonnehdinta. Tässä tapauksessa on kyse 
koirashaahkan värityksestä, joten koodaus on elollinen. Samaan kenttään 
on koodattu myös muuttujan syntaktinen asema (sb = subjekti), mikä ei 
ole aivan viisasta. Aina olisi hyvä, että jokaisella tiedolla olisi oma sarake. 


11) Kiintopiste on kognitiivisen kielentutkimuksen käsite, joka tarkoittaa 
huomion toissijaisena kohteena olevaa osallistujaa. Grammien tutki- 
muksessa kiintopisteen analyysi on melkeinpä muuttujaakin keskeisem- 
pi, koska se on grammien esiintymäkonstruktioissa ratkaisevan tärkeä 
jäsen. Tähän koodataan kiintopisteen ilmaisukeinon muoto. Leks tar- 
koittaa substantiivia, joka on yleisnimi, ja gen genetiiviä. 


12) Kiintopisteen semanttinen luokka. Vatsa on koodattu elollisen osak- 
si. Ruumiinosa olisi myös tähän mahdollinen koodaus, mutta tällä 
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tavoin erotetaan ihmisen ja muiden eläinten osat toisistaan. Ihminen 
on kuitenkin monella tavoin erityinen puheenaihe, ja siksi on hyödyllis- 
tä pitää se koodauksessa omana ryhmänään. Kiintopisteen semanttinen 
luokka on analyysissa ratkaisevan tärkeä seikka grammin merkityksiä ja 
käyttöalaa tarkasteltaessa. 


13) Kun tutkii sanojen käyttöä konstruktioissaan, voi sanajärjestys toi- 
sinaan olla tarpeellinen tieto. Juuri tämän esiintymän kohdalla mitään 
kommentoitavaa ei toistaiseksi ole ollut. 


14) Tutkimuskohteesta riippuen voi olla hyödyllistä koodata erikseen 
näkyviin jokin seikka esiintymäympäristöstä. Tässä tapauksessa sa- 
massa yhteydessä esiintyvien grammien analyysi on osoittautunut 
kiinnostavaksi. 


15) Huomautuksia-sarakkeeseen voi kirjata erilaista täydentävää tietoa 
ja koodauksen kuluessa herääviä kysymyksiä ja huomioita. Tähän on 
kirjattu esiintymän kontekstista varmistettu tieto, että puheen aiheena 
on haahkojen väritys. 


Yllä kuvatussa jäsennyksessä on kyse syntaktis-semanttisesta tutkimuk- 
sesta, ja siksi koodattavia seikkoja on runsaasti. Tämä ei tietenkään aina 
ole tarpeen. Havainnollistamme seuraavalla esimerkillä 2 sanasemant- 
tisessa tutkimuksessa käytetyn aineiston jäsennystä ja koodausta (Ojut- 
kangas 2010). 


Esimerkki 2 koodauksesta: 


Tunniste | Eläin- Sanan Luokka Lahko Määrite- | Perusosa | M-osan 
eläin tyyppi osa luokka 
160 orava- virall. lintu käet orava käki nisäkäs 
käki lajin- 
nimi 
1 2 3 4 5 6 7 8 


LUKU 7 LAADULLINEN AINEISTOPOHJAINEN KIELENTUTKIMUS 427 


M-osan motivaatio Tieteellinen | Englanniksi | Huomioita 
nimi 

toiminta: juoksee pitkin oksia ja hyppää Piaya Squirrel 

oksalta toiselle oravien tapaan, lentää cayana Cuckoo 

vain lyhyitä matkoja (http://en wikipedia. 

org/wiki/Sguirrel Cuckoo 21.8.2009) 

9 10 11 12 


1) Kuten esimerkissä 1. 


2) Tutkimuksen kohteena oleva sana ilman kontekstia, koska sa- 
nojen käyttö ei ollut tutkimuksen kohteena. Sanat kerättiin saata- 
vana olevista virallisen nimistön listoista (esim. Väisänen, R. A., 
Högmander, H., Björklund, H., Hänninen, L., Lammin-Soila, M., 
Lokki, J., Rauste, V. 2006: Maailman lintujen suomenkieliset nimet. 
(2. uudistettu p.); BirdLife Suomi: https://www.birdlife.fi/lintutieto/ 
maailman-lintulajien-suomenkieliset-nimet/.) 


3) Sanatyypillä seulottiin tutkimuskohteeksi nimenomaan lajinnimet ja 
jätettiin esimerkiksi heimojen nimet (kuten lehmäantiloopit) tutkimuk- 
sen ulkopuolelle. 


4) Tähän koodattiin lajin biologinen luokka, joka toimi tutkimusaineis- 
ton perusryhmittelynä. 


5) Lahko on luokkaa tarkempi biologinen ryhmittely, joka ei tässä tutki- 
muksessa lopulta ollut tarpeen. 


6) Tähän kirjattiin yhdyssanan määriteosana (eli ensiosana) oleva eläi- 
men nimi, joka oli varsinaisen kiinnostuksen kohteena. 


7) Yhdyssanan perusosan (eli viimeisen osan) kirjaaminen toimi parina 
edelliselle kohdalle mutta ei lopulta ollut kovin tarpeellinen erittely. 
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8) M-osan luokka tarkoittaa määriteosan nimeämän eläimen biologista 
luokkaa. Tärkeä pari kohdalle 4. 


9) Tähän kirjattiin määriteosan motivaatio: mitä määriteosa kertoo la- 
jista? Esimerkiksi orava käen määritteenä perustuu toimintaan, ennen 
kaikkea liikkumisen tapaan, ei esimerkiksi ravintoon (tämä laji ei syö 
oravia eikä oraville tyypillistä ravintoa) tai käen munien hautojaan ja poi- 
kasten kasvattajaan (oravakäet hautovat munansa ja hoitavat poikasensa 
itse). Näiden tietojen kokoamisessa käytettiin runsaasti eri lajeja kasit- 
televää lähdekirjallisuutta sekä internetin luotettavia biologisia lähteitä. 


10) Lajeista puhuttaessa on tärkeää kuljettaa tutkimuksessa mukana la- 
jien tieteellisiä nimiä, koska niiden avulla lajien jäljille pääsee, vaikka 
suomenkielinen nimi muuttuisikin. 


11) Englanninkielinen nimi vihjaa, että lajinnimessä on kyse käännös- 
lainasta, ja alun perin tavoitteena oli kirjata myös tieto lajin ruotsinkieli- 
sestä nimestä. Lajien nimeämisen tämän puolen tarkastelu jäi kuitenkin 
tutkimuksen ulkopuolelle. 


12) Kuten esimerkissä 1. 


Tutkimusaineiston koodaaminen käsin voi tuntua puuduttavalta ja me- 
kaaniselta, mutta se on erittäin hyvä tapa tutustua kerättyihin esiinty- 
miin ja syventyä tutkittavaan teemaan. Manuaalisen koodaamisen ehdo- 
ton etu on sen tarkkuus verrattuna automaattisiin annotointiohjelmiin 
ja parsereihin, joiden tarkkuus riippuu kielestä, tekstilajista ja annotoi- 
tavasta asiasta (annotointitarkkuuksista ks. Haverinen ja muut 2014; 
Dozat, Oi & Manning 2017). Toisaalta myös ihminen tekee koodaami- 
sessa virheitä. Koodaamisessa onkin hyväksyttävä tietty epävarmuus ja 
se, että tarkinkaan koodaaja tuskin saa kerralla valmista. Fi siis ole mi- 
tään syytä tuskastua, jos johdonmukaisuus tuntuu aluksi vaikealta tai 
jos joutuu koodaamaan joitakin osioita tutkimusaineistostaan useaan 
kertaan. On päinvastoin luonnollista, että tutkimuksen edetessä herää 
kysymyksiä, jotka edellyttävät jonkin uuden asian selvittämistä, ja tällöin 
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voi joutua käymään koko tutkimusaineiston läpi uudelleen. Lisäksi eten- 
kin monitulkintaisten ilmausten kohdalla tutkimusaineisto ei useinkaan 
asetu ongelmitta toisensa poissulkeviin luokkiin. Tällöin voi olla hyódyl- 
listä sallia tilanne, jossa yksittäinen ilmaus voidaan luokitella kahden eri 
kategorian alle. (Esim. Vartiainen 2016, 45-46.) 

Laadullisen aineistopohjaisen kielentutkimuksen menetelmän etu 
on, että se joustaa tutkimuksen etenemisen ja tutkijan uteliaisuuden 
mukana. Tällainen kehkeytyvä tutkimusasetelma (engl. emergent research 
design, ks. esim. Creswell 2014) mahdollistaa sen, että tutkija voi tarvit- 
taessa muokata koodaustapaansa tai jopa tutkimusaineistonsa koostu- 
musta tutkimuksen edetessä kertyneen tiedon perusteella. Näin tutkijan 
ei tarvitse sitoutua tiukasti tutkimuksen alussa tekemiinsä ratkaisuihin, 
mikäli myöhemmin osoittautuu, että ne eivät ole toimivia. 

Entä onko kuhunkin sarakkeeseen täytettävät nimilaput eli koodit 
syytä päättää etukäteen? Vastaus tähänkin kysymykseen riippuu tutki- 
muksen kohteesta ja siinäkin vielä erikseen koodattavasta seikasta. On 
seikkoja, joissa etukäteen päätetyt kategoriat helpottavat koodaamista. 
Tällaisia ovat esimerkiksi morfologiset ja syntaktiset ominaisuudet. Se- 
manttisten ominaisuuksien osalta sen sijaan voi olla hyödyllistä, että 
antaa tutkimusaineiston ohjata kategorioiden syntyä. Tällaisessa koo- 
daustavassa annetaan siis ensin semanttisten luonnehdintojen syntyä 
samalla kun esiintymiä käydään läpi. Tällaisten tutkimusaineiston ha- 
vainnointiin perustuvien luonnehdintojen perusteella voidaan sitten 
toteuttaa varsinainen koodaus, jossa ensikoodauksen ryhmiä voidaan 
yhdistellä yleisempien nimitysten alle tarpeen mukaan. Ensikoodauksen 
ei tarvitse kohdistua koko tutkimusaineistoon, vaan usein varsinaisten 
ryhmien muodostamiseen riittää, että käy läpi osan esiintymistä ja ha- 
vainnoi ja koodaa niiden ominaisuuksia. Toisinaan voi myös olla hyédyl- 
listä tehdä kattavampikin pilottitutkimus jollakin esiintymäjoukolla tut- 
kimusaineiston jäsennyksen ja koodauksen toimivuuden testaamiseksi. 
Pilottitutkimuksen perusteella voi koodausta muokata ennen kuin ryh- 
tyy tekemään varsinaista analyysia. 

Pilottitutkimus voi olla erityisen tarpeellinen silloin, jos tutkimus- 
aineiston järjestämisen apuna käytetään toista koodaajaa. Toisen koo- 
daajan käyttäminen nopeuttaa tutkimusaineiston koodaamista ja voi 
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olla hyödyllistä myös koodauksen laadunvarmistuksessa. Toista koodaa- 
jaa käytettäessä tutkimusaineiston järjestämisperiaatteiden tulee olla 
erityisen selkeästi ja tarkasti kuvattuja, jotta aineiston koodaus säilyy 
yhtenäisenä. 


3.3. ”Puhuu puolestaan”: tutkimusaineiston analysointi 


Systemaattisen tutkimusaineiston parissa työskentelyn parhaita puolia 
on se, että työskentelyn kuluessa melkeinpä väistämättä nousee esiin 
vihjeitä analysoitavien asioiden välisistä suhteista. Juuri ilmiöiden välis- 
ten vuorovaikutussuhteiden etsiminen on keskeinen kielentutkimuksen 
tavoite. Laadullisessa aineistopohjaisessa kielentutkimuksessa tutkija 
paneutuu inhimillisesti järkevän kokoiseen materiaaliin, josta pyritään 
hankkimaan systemaattista tietoa koodauksen avulla. Tutkijan tehtävänä 
on tarkkailla, kuunnella ja tulkita tutkimusaineistoa mahdollisimman 
ennakkoluulottomasti ja välittää havaintonsa tutkimusraportissaan. 
Kielentutkijoiden saatavilla on kuitenkin yhä enemmän tutkimus- 
aineiston käsittelyä helpottavia ja nopeuttavia automaattisia työkaluja 
(ks. tietolaatikko Laadullisen analyysin tekniset apuneuvot), joiden an- 
siosta yhä suurempien tutkimusaineistojen laadullinen analyysi tulee 
mahdolliseksi. 

Tietokanta- tai taulukkolaskentaohjelmissa on mahdollista käyttää 
ns. suodattimia (engl. filters). Niiden avulla saa ensinnäkin näkyviin 
sen, millaisia koodauksia kussakin sarakkeessa on käytetty, ja voi var- 
mistaa, että koodaus on johdonmukainen (kuva 1). Kuvassa 1 suodatin 
näyttää osan koodauksista, joita on käytetty edellä kuvatussa kahdesta 
eläimen nimestä koostuvien lajinnimien tietokannassa määriteosan luo- 
kan analysoimiseen. On hyvä huomata, että koodien joukossa on myös 
kysymysmerkki: tutkimusaineiston analyysiin jää väistämättä kohtia, 
joita on mahdoton selvittää ainakaan yksiselitteisesti. Tämä kuuluu 
kielen luonteeseen, sillä kielen kategoriat ovat harvoin jyrkkärajaisia ja 
kristallinkirkkaita. 
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Perusosa ~ M-osan lahk: + M-osan muo ~ M-osan moti ~ M-o! 


opossumi nisäkäs 2 SortAtoZ muoto: hiir 
opossumi nisäkäs | Zl sotztoA muoto: har 
opossumi "nisäkäs muoto: här 
kuskus nisäkäs % muoto: tuu 
kenguru "nisäkäs Text Filters > ito: kaikkire 
tanrekki nisäkäs ZH ^ muoto: pitk 
tanrekki nisäkäs [7] hyönteinen muoto, toir 
tanrekki "nisäkäs [7] hyönteinen: kehitysvaihe muoto, toir 
tanrekki nisäkäs [V] hyönteinen: sukupuoli. muoto, toir 
siili nisäkäs | [<] hämähäkkieläin muoto: piik 
päästäinen [nisäkäs ke] ihminen inta: kaivat 
kontiainen nisäkäs = a inta: pyydy 
lepakko | nisäkäs [7] lintu muoto: teri 
lepakko lintu [7] matelija w muoto, toir 
lepakko "nisäkäs muoto: "ha 
lepakko "myyttinen Cancel muoto: tylr 
lepakko myyttinen — --imuoto: om 
hankko nisäkäs | Petoeläimet ulkomuoto: pää 
lepakko | hyönteinen ulkomuoto, kok 
lepakko ‘kala ? 


Kuva 1. Kuvakaappaus tietokantaohjelman suodatintoiminnosta. 


Suodatin on yksinkertaisempi versio tietokantaohjelmien sisältämistä 
kysely-toiminnoista. Kyselyssä on mahdollista määrittää samanaikaises- 
ti useampaan sarakkeeseen kohdistuvat hakuehdot, joiden avulla voi 
tarkastella lähemmin jotakin aineiston osaa. Toki myös suodattimia on 
mahdollista käyttää kerroksittain, siten, että suodattaa useamman sarak- 
keen tietoja samanaikaisesti. 

Eri sarakkeiden välisten koodausten yhteydet tuovat esiin tutkimus- 
aineiston tarjoamia tuloksia. Jo koodatessa voi tehdä alustavia havain- 
toja mahdollisista suhteista, joiden olemassaolon haluaa tarkistaa, kun 
koodaus on valmis, mutta tutkimusaineistolla kannattaa myös ihan vain 
leikkiä: tehdä erilaisia hakuja, kyselyitä ja suodatuksia ja etsiä sillä ta- 
voin toisiinsa vaikuttavia seikkoja. Jos tutkittava aineisto on lause- tai 
virkemuodossa, miltä vaikkapa eri verbiryhmien ympärille rakentuneet 
esiintymät näyttävät? 

Esimerkiksi kahdesta eläimen nimestä koostuvissa lajinnimissä ha- 
vaittiin yhteys tarkasteltavan lajin luokan ja määriteosan luokan välillä: 
kunkin luokan lajinnimissä painottuvat saman luokan jäseniin viittaa- 
vat nimet (siis nisäkkäiden nimissä nisäkkäät, lintujen nimissä linnut 
jne., esim. vuohiantilooppi, allihaahka). Toisin sanoen havainnolliset 
nimitykset otetaan pääosin saman eliöryhmän piiristä, kun lajeja ni- 
metään toisen eläimen avulla. (Ojutkangas 2010.) Tämä esimerkki tuo 
esiin myös keskeisen menetelmien välisen yhteyden: laadullinenkin 
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analyysi hyödyntää usein jossakin määrin myös määrällisen analyysin 
menetelmiä (ks. Johdannon luvut 1 ja 4 tk.; Määrällinen korpuslingvis- 
tiikka tk.). Laadullisessakin tutkimuksessa määrälliset tiedot toimivat 
tyypillisesti tutkimuksen rajauksen perusteena tai yleisemmin tutki- 
muksen lähtökohtana, kun tutkimusaineistossa yleisiksi osoittautuneita 


ilmiöitä lähdetään tarkastelemaan lähemmin ja niille etsitään perusteita 
muualta kielen rakenteesta tai kielenulkoisesta maailmasta. Silloin kun 
tutkimusaineisto on kerätty systemaattisesti koostetusta aineistosta, on 
mahdollista myös suhteuttaa kielellisiä ilmiöitä niiden yleisyyden pe- 
rusteella (onko ilmiö kielessä yleinen vai harvinainen) tai verrata ilmiön 
esiintymistä erilaisissa tekstityypeissä (yleiskieli vs. erikoiskieli, eri-ikäi- 
set kielimuodot). Laadullisessa aineistopohjaisessa kielentutkimuksessa 
määrälliset tiedot ja varsinaiset tilastolliset menetelmät eivät kuitenkaan 
ole tutkimuksen keskiössä. 

Kaikki laadullisen aineistopohjaisen kielentutkimuksen esiin tuomat 
seikat eivät välttämättä liity ilmiöiden välisiin suhteisiin, vaan muunkin- 
laista tietoa voi luonnollisesti nousta esiin. Esimerkiksi ensimmäisen 
käyttämämme esimerkin Haahka on musta vatsan alta pohjalta voi teh- 
dä havainnon suomen ablatiivisijan merkityksestä: grammin muotona 
myös sillä voidaan ilmaista osa-kokonaisuus-suhdetta, joka on toisen 
erosijan, elatiivin, keskeisiä merkityksiä (vrt. musta vatsasta mutta ei 
vatsalta). 


Laadullisen analyysin tekniset apuneuvot 


Vaikka laadullista aineistopohjaista tutkimusta voi tehdä täysin manuaa- 
lisestikin, kielentutkijoiden saatavilla on lukuisia laadullista analyysia hel- 
pottavia teknisiä apuvälineitä. Aineiston keräämiseen, koodaamiseen ja 
tallentamiseen soveltuvia työkaluja ovat esimerkiksi erilaiset taulukko- 
laskenta- ja tietokantaohjelmat, kuten useimpiin Microsoft Office -paket- 
teihin kuuluvat MS Excel ja MS Access tai vastaavat vapaasti ladattavissa 
olevat Apache OpenOffice Base- ja MySOL-ohjelmat. Laadullisen analyy- 
sin tarpeisiin on kehitetty myös omia kaupallisia ohjelmia, kuten NVivo. 
NVivon vahvuutena on se, että se soveltuu hyvin kokonaisten tekstien 
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ja kuvien analyysiin, mihin tietokanta- ja taulukkolaskentaohjelmat eivat 
yleensä sovellu yhtä hyvin. 


Kielentutkijoille suunnattuja ohjelmistoja ovat esimerkiksi Laurence 
Anthonyn vapaasti ladattava AntConc-ohjelmisto sekä kaupallinen 
WordSmith Tools. Ohjelmistojen erilaiset työkalut auttavat löytämään 
kielessä usein toistuvia kuvioita, kuten kollokaatioita ja avainsanoja (ks. 
Määrällinen korpuslingvistiikka tk.). Tällainen tarkastelu voi olla hyö- 
dyllistä esimerkiksi tutkimuksen alkuvaiheen ideoinnin apuna, mutta 
nämä ohjelmistot tarjoavat myös määrällisiä tietoja, jotka voivat osoit- 
tautua merkityksellisiksi aineiston analysoinnissa (ks. Historiallinen 
korpuslingvistiikka tk.). 


4. Tulosten tulkinta 


Aitoja kielenkäyttöaineistoja hyödyntävissä tutkimuksissa tutkijan 
aineistolle antama rooli voi vaihdella. Kirjallisuudessa on käytet- 
ty kolmijakoa aineistoesimerkein tuettuihin (engl. corpus-illustrated/ 
corpus-exemplified) (Tummers, Heylen & Geeraerts 2005; Glynn 2014), 
aineistopohjaisiin (engl. corpus-based/corpus oriented) ja aineistovetoisiin 
(engl. corpus-driven) tutkimuksiin (Tognini-Bonelli 2001; Glynn 2014) 
(ks. myös Jantunen 2009; Ojutkangas 2008b; Luodonpää-Manni, Pent- 
tilä & Viimaranta 2017). Aineistoesimerkein tuetuissa tutkimuksissa 
kieliaineistoa hyödynnetään pääasiallisesti tutkijan omaan kielitajuun 
perustuvan analyysin havainnollistamisessa. Tällainen tapa käyttää 
aineistoa pelkästään esimerkkien tarjoamisessa on kuitenkin suoma- 
laisessa kielentutkimuksessa melko harvinainen. Aineistopohjaisessa 
tutkimuksessa tutkijan kielitajulla on myös oma roolinsa tutkimuksen 
suunnittelussa ja tutkimuksen lähtökohtien määrittelyssä (esimer- 
kiksi tutkimusaiheen valinta ja tutkimuskysymyksen muotoilu voi- 
vat perustua tutkijan tekemään havaintoon kielestä tai aikaisempaan 
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tutkimukseen), mutta toisin kuin aineistoesimerkein tuetuissa tutki- 
muksissa aineistopohjaisissa tutkimuksissa korpusaineistoja analysoi- 
daan ja havainnoidaan systemaattisesti. Aineistopohjainen tutkimus 
soveltuu hyvin suhteellisen laajojen kieliaineistojen analysointiin, ja se 
onkin hyvin suosittu tapa tehdä sekä laadullista että määrällistä tutki- 
musta. Aineistovetoiset tutkimukset eroavat aineistopohjaisista tutki- 
muksista mm. siten, että siinä missä aineistopohjaisissa tutkimuksissa 
analyysi voi perustua esimerkiksi tutkimuksen teoriasta kumpuaviin 
luokituksiin, aineistovetoisissa tutkimuksissa analyysikategorioiden an- 
netaan muotoutua aineiston itsensä perusteella. Aineistovetoiset tut- 
kimukset ovat yleisesti ottaen tavallisempia määrällisissä korpustutki- 
muksissa (ks. Määrällinen korpuslingvistiikka tk.), sillä tarkastelussa 
käytetään tyypillisesti tilastollisia menetelmiä, joilla pyritään selvittä- 
mään kielellisten ilmiöiden yleisyyttä kielenkäytössä. 

Tässä artikkelissa on kuvattu aineistopohjaisen kielentutkimuksen 


menetelmää, mutta siinä on myös aineistovetoisen tutkimuksen piir- 
teitä, sillä osa analysoitavista kategorioista muodostetaan aineistossa 
havaittujen piirteiden pohjalta. Tutkijan tuleekin itse ratkaista, missä 
määrin hän tukeutuu tutkimuksen teoriataustan ja aikaisempien tutki- 
musten tarjoamiin kategorioihin ja missä määrin hän antaa aineistosta 
tekemiensä havaintojen ohjata analyysia. Valintaan vaikuttaa mm. tut- 
kimuskysymys: halutaanko esimerkiksi testata olemassa olevia teorioita 
vai etsiä aikaisemmin kartoittamattomia ilmiöitä? 

Vaikka kovin tarkan rajan vetäminen erityyppisten tutkimusten välille 
voi olla turhaa, tutkijan on kuitenkin hyvä olla tietoinen siitä, millai- 
sen roolin hän antaa tutkimusaineistolleen ja mikä hänen oma roolinsa 
tutkimuksessa on tiedonkäsittelijänä. Aineistopohjaisuus sen parem- 
min kuin aineistovetoisuuskaan eivät tarkoita teoriatonta tutkimusta: 
kategoriat eivät nouse aineistosta itsestään, vaan tarvitaan aina tutkijan 
suorittamaa tulkintaa tutkimusaineiston olennaisista piirteistä. On hyvä 
huomata, että tämä tulkinta ei synny tyhjästä, vaan tutkijan aikaisemmat 
tiedot tutkimuskohteesta, teoreettinen tausta ja metodologiset valinnat 
ohjaavat myös tutkittavan ilmiön havainnointia (ks. Niiniluoto 1980, 
224-225). Tutkimuksen teoreettiset ja metodologiset ratkaisut tuleekin 
kirjoittaa huolellisesti auki, jotta niitä voidaan arvioida avoimesti. 
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Konkreettisesti tulosten tulkitseminen tarkoittaa tutkimusaineiston 
analyysivaiheessa tehtyjen havaintojen kirjoittamista tekstin muotoon. 
Kirjoittamalla konkretisoidaan ilmiöiden välisiä suhteita ja pohditaan, 
miten ne voidaan selittää. Koska kirjoittaminen on prosessi, ei kannata 
arkailla kirjoittaa näkyviin oudoilta, triviaaleilta tai epäuskottaviltakin 
tuntuvia seikkoja. Niiden rooli tulosten tulkinnassa varmistuu vasta työn 
edetessä. Usein voi olla niin, että kaikkein itsestäänselvimmältä tuntu- 
nut havainto on tulosten kannalta perustavanlaatuisin. On myös hyvä 
huomata, ettei tutkimusprosessi useinkaan ole täysin lineaarinen, niin 
että vaiheet seuraisivat toisiaan limittymättä. On tavallista, että analyysia 
ja tulkintaa tehdään vuorovaikutuksessa; jokin tulkinta voi esimerkiksi 
tuottaa tarpeen analysoida tutkimusaineistoa uudesta näkökulmasta, 
ja jonkin havainnon tekeminen voi tehdä kirjoittamisen tarpeelliseksi, 
vaikkei analyysi vielä olisi täysin valmis. 

Usein on hyödyllistä kirjoittaa varsin yksityiskohtaisestikin näkyviin 
ratkaisut, joita on tehnyt tutkimusaineiston käsittelyssä. Miten esimerkik- 
si lopullinen tutkimusaineisto rajattiin? Tämä kytkeytyy tiiviisti tutkimus- 
kysymysten tarkentumiseen. Myös käytettyjen suodattimien tai kyselyjen 
kuvaaminen tekstin muodossa voi auttaa tutkijaa hahmottamaan, miten 
tekstiä kannattaa rakentaa; tutkimusaineiston luokittelutapaa voi siis käyt- 
tää hyödyksi tutkimuksen rakennetta suunniteltaessa. Tekstin viimeistely- 
vaiheessa sitten tehdään päätös siitä, mikä osa tällaisesta tutkimusproses- 
sin kuvauksesta on myös lopullisen työn lukijalle hyödyksi. Tutkimuksen 
mahdollisimman suuri läpinäkyvyys helpottaa tieteellistä laadunvarmis- 
tusta, ja yhä useammat kielentutkijat julkaisevatkin aineistonsa avoimesti 
kaikkien tutkijoiden saataville esimerkiksi Kielipankin kautta.? 

Tutkimusaineistosta tehtyjen havaintojen kuvaaminen ja tulkitse- 
minen tarkoittaa samalla myös käytettyjen teoreettisten käsitteiden ja 
näkökulmien kytkemistä konkreettiseen materiaaliin. Tutkimuksen 
teoriatausta auttaa havaintojen systematisoinnissa ja rikastuttaa tutki- 
jan ilmiötä koskevia pohdintoja tarjoamalla välineitä käsitellä ilmiötä 
monipuolisemmin kuin mitä ilman tällaisia taustatietoja olisi mahdol- 
lista (Eskola & Suoranta 1999, 80; vrt. Creswell 2014, 64). Toisaalta 
tutkimusaineistosta tehtyjä havaintoja voidaan tarkastella myös teorian 
testauksen näkökulmasta ja pohtia, miltä osin ne tukevat aikaisempia 
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tutkimustuloksia ja miltä osin teoriaa olisi ehkä syytä tarkentaa. Tulos- 
ten tulkinnassa pyritään siis vastaamaan kahteen kysymykseen, joiden 
keskinäinen painoarvo voi totta kai vaihdella eri tutkimuksissa: Mitä 
käytetty tutkimusaineisto paljastaa tutkittavan kielen ominaisuuksista 
valitussa teoriataustassa tarkasteltuna? Miten käytetty tutkimusaineisto 
voi kehittää tai haastaa käytetyn teoriataustan näkemyksiä? Ilman tällais- 
ta tutkimustulosten ja teoriataustan vuoropuhelua tutkimusaineistosta 
tehdyt päätelmät ovat vain irrallinen joukko havaintoja, joita ei kytketä 
mihinkään aiempaan tutkimukseen, eikä niiden arvoa ole näin ollen 
mahdollista arvioida. Tutkimustulosten suhteuttaminen laajempaan tie- 
teelliseen kontekstiin onkin olennainen osa tutkimuksen raportointia. 
Valittu teoreettinen näkökulma ohjaa tulosten tulkinnan suuntaa, ja 
eri näkökulmien käyttäminen tarjoaa mahdollisuuden käyttää samaa 
tutkimusaineistoa useampaan eri tarkasteluun. Esimerkiksi edellä esi- 
telty grammitietokanta on rakennettu niin, että sen teoriataustana on 
kognitiivinen kielentutkimus. Tämän teoriakehyksen sisällä tietokanta 
on toiminut materiaalina paitsi grammien syntaktis-semanttisessa ana- 
lyysissa myös niin sanottujen viittauskehysten tarkastelussa" ja kieli- 
opillistumistutkimuksessa, ja koko ajan tärkeänä taustana on toiminut 
myös kielitypologinen ajattelu eli se, mitä vastaavista ilmiöistä maailman 
kielten näkökulmasta tiedetään. Valittu teoria voi luonnollisesti tuoda 
mukanaan myös tarpeen liittää tutkimukseen muitakin menetelmiä: esi- 
merkiksi kieliopillistumistutkimus edellyttää kielihistoriallisten menetel- 
mien hyödyntämistä (ks. Historiallinen ja vertaileva kielentutkimus tk.). 
Nykyisin on yhä yleisempää, että aineistopohjaisessa kielentutkimuk- 


sessa yhdistetään sekä laadullista että määrällistä tutkimusta. Laadullisia 
menetelmiä hyödyntäen voidaan esimerkiksi ensin kartoittaa ilmiötä 
kokonaisvaltaisesti ja nostaa sitten kiinnostavia kohtia määrälliseen tar- 
kasteluun ilmiön yleisyyden kartoittamiseksi. Toisaalta ilmiötä voidaan 
myös tarkastella ensin määrällisesti ja poimia määrällisessä tarkastelus- 
sa huomiota herättäviä kohtia tarkempaan laadulliseen tarkasteluun. 
Laadullinen aineistopohjainen kielentutkimus ja määrällinen korpus- 
tutkimus tulisikin mielestämme nähdä toisiaan täydentävinä menetel- 
minä, jotka soveltuvat erilaisiin tarkoituksiin ja vastaavat erilaisiin tut- 
kimuskysymyksiin. (Ks. Johdannon luvut 1 ja 4 tk.) 
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5. Yhteenveto 


Laadullisen aineistopohjaisen kielentutkimuksen etuja ovat sen hyvä 
soveltuvuus erilaisiin tutkimusaiheisiin ja menetelmän joustavuus. 
Se soveltuukin lähes kaikenlaisten tutkimusaineistojen analysointiin. 
Sen erityisiä vahvuuksia ovat monimutkaisten ilmiöiden jäsentäminen, 
näkökulmien laajentaminen ja ymmärryksen lisääminen tutkimus- 
kohteesta, joka voi olla entuudestaan kartoittamaton. Yleisesti laadulli- 
sen analyysin heikkouksina pidetään tutkimuksen hitautta, työläyttä ja 
huonoa yleistettävyyttä, etenkin jos käytetään pieniä tutkimusaineistoja. 
Kielentutkijoiden saatavilla on kuitenkin yhä enemmän tutkimusaineis- 
ton käsittelyä helpottavia ja nopeuttavia automaattisia työkaluja, joiden 
ansiosta yhä suurempien tutkimusaineistojen laadullinen analyysi tulee 
mahdolliseksi. Lisäksi tutkimustulosten luotettavuuden varmistamiseksi 
on kehitetty erilaisia menetelmiä, kuten tutkimusaineiston systemaattis- 
ta järjestämistä tukevia ohjelmia ja kahden koodaajan käyttöä koodauk- 
sen laadunvarmistuksessa. 
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VIITTEET 


1 Kiitämme artikkelimme toimittajia, kommentoijia ja arvioijia hyödyllisistä kommenteis- 
ta. Milla Luodonpää-Manni on saanut rahoitusta artikkelin kirjoittamiseen Varsinais- 
Suomen rahastolta ja Krista Ojutkangas Suomen Akatemialta (285739). 

2 Keskeinen osa fennistiikan syntyä on tietysti myös kielioppien kirjoittaminen, mikä oli 
tärkeää mm. siksi, että suuri osa vielä 1800-luvun kielimiehistä oli äidinkieleltään tai 
vähintään koulusivistykseltään ruotsinkielisiä (ks. esim. Häkkinen 2008, 65—73). 

3 https://www.kotus.fi/kielitieto/kielenkayton lajit/puhuttu kieli/murteenseuruuhanke. 

4 Hankkeen kuvaus: https://www.utu.fi/fi/yliopisto/humanistinen-tiedekunta/ 
suomen-kieli-ja-suomalais-ugrilainen-kielentutkimus/suomen-kieli/tutkimus. 
Aineisto kielipankissa: http://urn.fi/urn:nbn:fi:lb-2014073026 

5 http://syntaxarchives.utu.fi/Graduja/. 


6 Eri menetelmiä voi olla tarpeen yhdistää myös silloin, jos kaikkia olennaisia tutkimus- 
kysymyksiä ei pysty ratkaisemaan aitojen kielenkäyttöaineistojen avulla (esim. Luo- 
donpää-Manni (2016) aineistopohjaisen laadullisen kielentutkimuksen menetelmän ja 
kyselymenetelmän yhdistämisestä). 

7 Lauseopin arkiston esittely osoitteessa http://syntaxarchives.suo.utu.fi/. Arkiston aineis- 
to on käytettävissä Korpissa (https://www.kielipankki.fi/tuki/korp/). 

8 Tätä vaihetta tutkimusaineiston käsittelyssä nimitetään annotoinniksi, mikäli se tapahtuu 


niin, että merkinnät ovat konelukuisessa muodossa (esim. xml). Koodaamiseen sisältyy 
siis käsityön ajatus. 

9 Ks. https://avointiede.fi/fi. 

10 Viittauskehyksissä on kyse siitä, miten ns. akseligrammien ilmaisemat sijainnit tulki- 


taan. Esimerkiksi lause Pallo on auton edessä voidaan tulkita joko niin, että pallo on 
tilanteen tarkastelijan ja auton välissä (ns. relatiivisen viittauskehyksen mukainen tul- 
kinta), tai niin, että pallo on auton edessä auton kulkusuuntaan nähden (ns. luontaisen 
viittauskehyksen mukainen tulkinta). (Levinson 2003; suomesta Ojutkangas 2005.) 
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Luku 8 Kasiteanalyysi kielentutkimuksessa 


Reetta Konstenius 


Mika? 


Käsiteanalyysi tarkoittaa usein jonkin tietyn (teoreettisen) käsitteen mer- 
kityksen purkamista ja pilkkomista sekä suhteuttamista lähikäsitteisiin ja 
johonkin laajempaan taustakäsitejärjestelmään. Käsiteanalyysin päämää- 
ränä on koherentti ja yhtenäinen kuva jonkin tietyn käsitteen merkitys- 
sisällöstä ja suhteista muihin käsitteisiin. Se on tieteellinen filosofinen 
menetelmä, jolla voidaan jäsentää abstraktien käsitteiden tietosisältöjä. 
Se on myös välttämätön osa kaikkea tieteellistä tutkimusta, sillä tutki- 
joiden on tutkimuksessaan määriteltävä, avattava ja perusteltava käyttä- 
mänsä keskeiset käsitteet. 


Katso myös: 
Luku 1 Kielitaju kielentutkijan työkaluna 


Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 
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1. Johdanto 


Käsiteanalyysi tarkoittaa nimensä mukaisesti käsitteiden eli ajattelun ja 
päättelyn perustana toimivien merkityssisältöjen analyysia, ja se eroaa 
siksi muista vastaavanlaisista metodeista, kuten sanasemantiikasta, 
leksikologiasta tai terminologiaopista. Käsiteanalyysin päämääränä on 
koherentti ja yhtenäinen kuva jonkin tietyn käsitteen merkityssisällös- 
tä. Sanasemantiikka vuorostaan on leksikologian osa, jossa tutkitaan 
sitä, mitä eri merkityksiä, suhteita tai muutoksia lekseemeillä on. Vaik- 
ka nämä kaksi tutkimusmetodia käyttävät jokseenkin samankaltaista 
menettelyä, metodien väliset erot ilmenevät erityisesti tutkimusnäkö- 
kulmassa ja tutkimuksen päämäärissä. Lekseemit kuuluvat kielen sa- 
nastoon, ja ne toteutuvat erilaisina sananmuotoina. Sanasemantiikassa 
tutkimuksen kohde on yleensä jollakin tavoin merkityksen ja muodon 
suhde. Sanasemantiikassa tärkeitä ovat sellaiset termit, jotka ilmaisevat 
leksikaalisia suhteita, kuten polysemia, metonymia, homonymia ja anto- 
nymia. Käsitteet vuorostaan toteutuvat merkityksissä, ja käsiteanalyysin 
päämääränä on eritellä ja konstruoida merkityksiä suhteessa johonkin 
taustakäsitejärjestelmään. Käsiteanalyysi eroaa siten myös onomasio- 
logisesta kielentutkimuksesta, jossa tutkitaan jonkin tietyn käsitteen 
ilmenemistä eri murteiden tai kielten sanastossa (esim. Nirvi 1952). 
Käsiteteanalyysin erityispiirteenä voidaan pitää sitä, että tutkimus suun- 
tautuu yleensä yhteen tiettyyn käsitteeseen (ks. esim. Jouhki & Penna- 
nen 2016; Hyvärinen, Kurunmäki, Palonen, Pulkkinen & Stenius 2003). 


2. Mitä tutkitaan, kun tutkitaan käsitettä? 


Kielentutkijan vastaus kysymykseen, mitä käsitteet ovat, määrittää sekä 
analyysitekniikkaa että tutkimuksen taustafilosofiaa. Frityisen mielen- 
kiintoista käsitteiden tutkimuksen näkökulmasta on se, että teoria kä- 
sitteistä johtaa yleensä sellaisiin metafyysisiin sitoumuksiin, joilla on 
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kokonaisvaltaisia seurauksia tutkimuksen edustamalle ja tuottamalle 
maailmankatsomukselle. Seuraavassa on muutamia tunnettuja esimerk- 
kejä tästä. 

Käsiterealisti Platon ajatteli, että ideat ovat ikuisia universaaleja ja 
siksi käsitteiden tutkimus kohdistuu johonkin reaalitodellisuuttakin to- 
dellisempaan transendentaaliseen ilmiöön. Käsiteanalyysin avulla saavu- 
tettu tutkimustulos kertoo itse todellisuuden perimmäisistä rakenteista. 
Platonin käsiterealismi on dualismia, sillä se olettaa kaksi todellisuutta: 
idea- ja materiamaailman. Materiamaailmassa elävä ihminen saavuttaa 
ikuiset ideat sielunsa avulla. Tämä sielussa tapahtuva muistaminen on 
rationalistin mukaan todellista tietoa, kun taas aistein havaittu tieto on 
harhaa (ks. kuvio 1). 


ideamaailma sielu no idea 


jürki 


materiaalinen 


"m : ruumis aistiharha x 
materiaalinen maailma heijastus 


Kuvio 1. Platonin dualistinen käsiterealismi. 


Ideaoppi voi olla myös monistinen: esimerkiksi jotkin uudet modernit 
metafyysiset teoriat ovat ehdottaneet, että maailman perimmäinen luon- 
ne on matemaattinen. Universumit (engl. multiverse) perustuvat mate- 
maattiselle rakenteelle (engl. mathematical universe hypothesis) ja ovat 
luonteeltaan komputationaalisia (engl. computable universe hypothesis). 
Havaitsemamme ulkoinen todellisuus on siten fysikaalista komputaa- 
tiota ja ihminen on itsestään tietoinen komputationaalinen alarakenne 
(engl. self-aware substructure) (ks. esim. Tegmark 2014). Yleiskäsitteet 
ovat tämän näkemyksen mukaan matemaattisia. 

Maltilliset käsiterealistit seuraavat Aristoteleen (1994) jäljissä ja 
yleensä uskovat, että käsitteet tai universaalit ovat osa maailman loogista 
rakennetta. Käsitteiden analyysin tulos siis paljastaa jotakin maailman 
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rakenteesta. Tämän klassisen näkemyksen mukaan käsitteet ovat tarkka- 
rajaisia ja ne voidaan määritellä välttämättömien ja riittävien piirteiden 
kautta. Klassinen käsiteanalyysi onkin loogista ja strukturoitua välttä- 
mättömien ja riittävien piirteiden määrittelemistä. Klassisessa teoriassa 
käsitteen määritelmää kutsutaan usein mieleksi tai intensioksi ja vuo- 
rostaan alaksi tai ekstensioksi sitä joukkoa, johon kuuluvat määritel- 
lyn kategorian jäsenet. Mitä laajempi on käsitteen ala, sitä vähemmän 
yhteistä kategoriaan kuuluvilla olioilla yleensä on, eli käsitteen mieli eli 
intensio supistuu. Esimerkiksi käsite ELÄIN kattaa monia keskenään eri- 
laisia olioita, ja sen määritelmä on siten lavea. Vastaavasti KOIRA kattaa 
kapeamman alan olioita, ja tämän käsitteen määritelmä on näin yksityis- 
kohtaisempi (Kakkuri-Knuuttila 1998).' Käsiterealismille on tyypillistä 
jonkinlainen uskomus siihen, että käsitteet kuvastavat maailman luon- 
nollisia kategorioita. Syy siihen, miksi kategorioita IHMINEN ja KOIRA 
yhdistää kategoria ELÄIN, on se, että sama luonnollinen selitys koskee 
kumpaakin kategoriaa. Käsitteiden ja maailman välillä on jonkinlainen 
välttämätön viittaussuhde: ihminen havaitsee tai löytää kategorian jäsen- 


ten väliset suhteet järkensä avulla. 


MAAILMA ja luonnollinen järjestys 


Ihminen löytää ALA: kategorian 


järkensä avulla MIELI: käsitteen määritelmä. jäsenet. 
käsitteen mielen. Riittävät ja välttämättömät 


piirteet. 


Kuvio 2. Aristoteelinen käsitys käsitteiden luonteesta. 


Aristoteeliseen perinteeseen voidaan lukea erilaiset totuusehtoseman- 
tiikat ja referenssiin perustuvat merkitysteoriat, sillä ne olettavat mer- 
kityksen rakentuvan kielen ja maailman välisessä suhteessa (Forrai 
2001). Sekä Platon että Aristoteles olivat käsiterealisteja, eli he uskoi- 
vat, että käsitteillä on itsenäinen ihmisestä riippumaton olemassaolo. 
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Epistemologia kuitenkin erottaa nämä kaksi näkemystä: Platon oli ra- 
tionalisti, sillä hän uskoi, että sielu havaitsee käsitteen totuuden. Aris- 
totelesta vuorostaan voidaan pitää historian ensimmäisenä tunnettuna 
empiristinä, sillä hän uskoi, että järki näkee reaalimaailmassa esiinty- 
vissä yksilöjoukossa yhteiset tekijät. 

Käsiterealistit voidaan siis jakaa rationalisteihin ja empiristeihin. 
Esimerkiksi formaalin kielentutkimuksen semantiikan taustateorioista 
Jerry Fodorin (1981) mentalese, jonka mukaan ajattelun kielellä on kieli- 
oppia muistuttava rakenne, edustaa rationaalista käsiterealismia. Fodor 
pyrki laajentamaan Jerrold Katzin kanssa Chomskyn ajatuksia seman- 
tiikasta, ja yhdessä he julkaisivat artikkelin The Structure of a Semantic 
Theory (1963). Fodorin teoriaa voi olla monen vaikea sulattaa, sillä tee- 
si käsitteiden sisäsyntyisyydestä johtaa siihen väitteeseen, että ihmiset 
kautta aikojen olisivat syntyneet esimerkiksi sellaiset käsitteet kuin 
INTERNET ja KOGNITIIVINEN KIELIOPPI mielessään. 

Siinä missä klassisessa teoriassa lähdetään liikkeelle määritelmästä, 
josta dedusoidaan kategorian jäsenet, uudemmissa merkitysteorioissa 
edetään vastakkaisessa suunnassa. Esimerkiksi kielen käyttöteorioissa 
ja prototyyppiteorioissa päätelmät käsitteen merkityssisällöstä johde- 
taan kategorian jäsenien yhteisistä piirteistä induktiivisesti, alhaalta ylös, 
eli jossakin kerätyssä aineistossa esiintyvistä viittauskohteista päätel- 
lään vaikkapa käsitteen ELÄIN keskeiset tai yhdistävät piirteet (ks. esim. 
Taylor 2008; Geeraerts 2006). Modernin käsiteanalyysin taustalla on 
usein jonkinlainen versio Wittgensteinin (1953) kielen käyttöteoriasta: 
merkitys muodostuu käyttöyhteyden kautta. Wittgenstein käyttää termiä 
kielipeli, jossa pelin säännöt ja itse pelattu peli muodostavat merkitys- 
systeemin. Kielen käyttöteoriassa jonkin lekseemin ja sen synonyymien 
esiintymiä kerätään ja tulkitaan käyttöyhteydessään rinnakkain. Kielen 
käyttöteoriat ymmärtävät kielen merkityksen luonteeltaan sosiaaliseksi. 
Tämä tarkoittaa sitä, että vaikka jollakin olisi väärä idea sanan eläin mer- 
kityksestä, tämä harhaluulo ei millään tavalla vaikuta kielen merkityksen 
muodostumiseen eli muuta sanan vakiintunutta merkitystä. 

Kielen käyttöteorioiden ja prototyyppiteorioiden välinen ero on juuri 
se merkitys, joka annetaan ihmisen mielelle. Kognitiivinen kielitiede, 
jossa prototyyppiteoriaa on sovellettu, esimerkiksi olettaa, että käsitteet 


446 REETTA KONSTENIUS 


ja kategoriat ovat ihmisen mielessä, ja niitä kutsutaan vaihtelevasti neuro- 
logisiksi kuvioiksi, mielikuviksi tai prototyypeiksi (ks. esim. Dodge & Lakoff 
2005; Kenttä 2001). Tämä koulukunta antaa merkitystä muodostavan 
roolin ihmisen psykologiselle kyvylle kategorisoida, ja tutkimus kohdis- 
tuu usein juuri kategorian rakenteeseen ja sen jäseniin. Lakoff (1987) 
esittää, että ihmisen havaintomekanismit yhdessä kulttuuristen arvojen 
ja käytäntöjen kanssa ohjaavat kategoriapäätelmiin siten, että kategorian 
yläpäässä voi toisinaan olla melko mielivaltainenkin abstraktio. Esimer- 
kiksi käsitteitä NAINEN ja TULI voi yhdistää jossakin kielessä yläkategoria 
VAARA. 

Edellisen perusteella huomaamme, että se, nimitetäänkö käsitteen 
merkityssisältöä mieleksi, mielikuvaksi vai käytöksi, riippuu omaksutuis- 
ta merkitysnäkemyksistä. Yhteistä useimmille merkitysteorioille näistä 
eroista huolimatta on, että abstraktien ja vertailevien käsitteiden ole- 
tetaan olevan luonteeltaan erilaisia tai pitävän sisällään yleensä muita 
käsitteitä. Abstraktit käsitteet eivät välttämättä viittaa mihinkään omaan 
luokkaan reaalimaailmassa; emme voi havaita aisteillamme tai ajatella 
esimerkiksi negaatiota (£1) tai vertailusuhdetta (1somrt1) erillään muista 
käsitteistä (ks. esim. Lukose, Delugach, Keeler, Searle & Sowa 1997). 
Konkreettisten käsitteiden (esim. HEVONEN) ajatellaan vuorostaan ni- 
meävän tai edustavan todellisuudessa havaitsemiemme luonnollisten 
luokkien tai kategorioiden yleisiä piirteitä. 

Merkitysteoriat voidaan edelleen jakaa kontekstuaalisiin (kielen 
käyttöteoriat) ja atomistisiin (prototyyppiteoriat, totuusehtosemantiikka). 
Kun kontekstuaaliset teoriat korostavat asiayhteyksiä, niin atomistiset 
teoriat olettavat, että käsitteellä on käyttöön nähden tietyssä määrin itse- 
näinen merkityssisältö. 

Merkitysteorioiden suuressa tarjonnassa uudet teknologiat tarjoavat 
kielentutkijalle pragmaattisen tavan päätellä jotakin merkitysteorian 
pätevyydestä. Esimerkiksi uudet oppivat tekoälyt käyttävät hyväkseen 
hierarkkista merkitysteoriaa. Convolutional neural networks pilkkoo ha- 
vainto- ja oppimispäätelmät hierarkkisiin rakenteisiin eli käsittelee kie- 
lellistä informaatiota käsitteenmuodostuksessa paloina, joita se tulkin- 
nan kuluessa vertaa toisiinsa koherenssin muodostamiseksi. Tämä deep 
learning -algoritmi, jota käytetään yhä enemmän puheen tulkinnassa, 
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käännöksissä ja tekstin ymmärryksessä, on oppiva neuroverkko, joka 
muodostaa käsitteen alhaalta ylös ja vuorottelee havainnosta tehdyn 
induktion ja päättelyyn perustuvan deduktion välillä (LeCun & Bengio 
1995). Tämä voi kertoa siitä, että myös ihmiset vuorottelevat erilaisten 
syötteiden ja prosessien välillä. 

Kielifilosofiassa on siis esitetty keskenään suuri joukko erilaisia mer- 
kitysteorioita, joista osa esittää, että kielen merkitys on itsenäinen eli 
mikään ihmisen tulkinta ei vaikuta siihen, ja toiset taas esittävät, että 
viestin lähettäjä tai tulkitsija määrää merkityksen. Alla olevassa laatikos- 
sa on ajatuskoe, joka auttaa arvioimaan omia intuitioita kielen merkityk- 
sen rakentumisesta (ks. esim. Riemer 2015). 


Ajatuskoe käsitteestä kieli 


Tämän ajatuskokeen tehtävänä on auttaa sinua arvioimaan, millä tavalla 
itse uskot, että viestijän intentio, tulkinta, tietoisuuden aste tai alkuperä 
vaikuttavat merkitykseen. Ajatuskokeen avulla voit arvioida intuitioitasi 
siitä, missä olosuhteissa sanalla on mielestäsi jokin tietty merkitys ja 
milloin ylipäätään kyse on kielestä, milloin muusta kuin kielestä. 


Löydät lapun, jossa lukee aita. Suomeksi aita on 'maa-aluetta rajoitta- 
va rakenne’ mutta baskiksi 'isà'. Erilaisen tausta- ja tilannetiedon sekä 
tekemiesi havaintojen perusteella saatat päätyä mm. seuraaviin eri tul- 
kintoihin: 


a) Kirjoittaja on baski, joka kirjoitti lappuun isä baskiksi osoittaen sen 
isälleen. 


b) Kirjoittaja on suomalainen, joka kirjoitti lappuun aita viitaten omaan 
puutarha-aitaansa. 


c) Kirjoittaja on baski, joka kirjoitti lappuun isä baskiksi, mutta uskot, 
että sana on suomea ja tarkoittaa puutarha-aitaa. 


d) Sanan aita kirjoitti baski narraavan suomalaisen sanelemana. Baski 
luuli kirjoittaneensa isä, vaikka sanelija mielessään tarkoitti puutarha- 
aitaa. 
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e) Teksti aita on osa revittyä lappua, jossa alun perin luki asianlaita. 
f) Kirjainjonon tuotti kone, joka sattumalta yhdisti kirjaimet keskenään. 


g) Kirjainjonon tuotti kone, joka puutarhamessuilla aivan tarkoituksella 
osoitti jokaiselle esineelle nimen. 


h) Kirjainjonon tuotti kone, joka puutarhamessuilla aivan tarkoituksella 
osoitti jokaiselle esineelle nimen mutta sekoitti pelargoniat ja aidat 
keskenään. Kone nimesi vahingossa pelargoniat aidoiksi. 


i) Suomalainen yritti kirjoittaa auta, mutta jostain syystä u näyttää i:ltä. 


j) Lappu on osa arkeologista löytöä, eikä ole olemassa enää yhtään kieli- 
yhteisön jäsentä, joka osaisi kertoa, mitä aita kyseisellä ja tilanteessa 
tuntemattomalla kielellä tarkoittaa. 


Onko kieli siis riippuvainen puhujan intentiosta, kuulijan tai lukijan 
tulkinnasta, ihmisen ideoivasta mielestä? Tuottaako mitään ymmär- 
tämätön kone kieltä? Voiko virheellinen tulkinta viestistä olla edelleen 
kieltä? Voiko virheellinen tietokoneohjelmisto tuottaa vahingossa kieltä? 
Onko kaikki kieli kommunikaatiota? Oleellista tässä ajatuskokeessa on 
ymmärtää, että pelkkä kirjoitusmuoto tai kirjainjono ei vielä oikeastaan 
kerro, kuuluuko se johonkin kieleen tai onko se kieltä. Vaikka muoto 
olisi eräs edustus lekseemistä, se ei silloinkaan välttämättä ehkä olisi 
kaikissa tapauksissa kieltä, jos kieleen kuuluu intentio, oikea tulkinta tai 
kieliyhteisön normi. 


LUKU 8 KÄSITEANALYYSI KIELENTUTKIMUKSESSA 449 


3. Millaisessa tutkimuksessa käsiteanalyysia 
käytetään? 


Käsiteanalyysia pidetään usein filosofialle tyypillisenä menetelmänä, 
sillä se on luonteeltaan analyyttista ja sen päämääränä on synteettinen 
yhtenäinen tiedollinen esitys käsitteen sisällöstä eli näkemys. Esimerkik- 
si kielifilosofiassa tutkitaan kieleen liittyviä käsitteitä ja niiden sisäistä 
rakennetta sekä yhteyttä muihin käsitteisiin ja teorioihin. Kielifilosofia 
pohtii sellaisia kysymyksiä kuin ”Mitä on merkitys?” ja ”Mikä on nor- 
mi?”. Usein käsiteanalyysi on ainoa tieteellinen tutkimusmetodi, jolla 
voidaan jäsentää abstraktien käsitteiden tietosisältöjä, koska ne pitävät 
sisällään ainoastaan muita käsitteitä eivätkä viittaa mihinkään aistein 
havaittavaan luonnolliseen luokkaan reaalimaailmassa (Rescher 2001). 

Käsiteanalyysi ei rajoitu kuitenkaan pelkästään filosofiaan, vaan se 
on välttämätön osa kaikkea tieteellistä tutkimusta; tutkijoiden on tutki- 
muksessaan määriteltävä käyttämänsä keskeiset käsitteet. Tieteen kielen 
tulee olla yksimerkityksistä ja täsmällistä, ja siksi käsitteiden huolellinen 
määrittely edellyttää käsitteen aikaisemman käytön sekä käsitteelle an- 
nettavien erilaisten merkitysten analysoimista. Tutkijan on eksplisiitti- 
sesti perusteltava käyttämänsä merkitykset ja osoitettava käyttämiensä 
käsitteiden ja muiden samankaltaisten käsitteiden väliset yhtäläisyydet 
ja erot (ks. Niiniluoto 1997; Kakkuri-Knuuttila 1998). 

Frityisen oleellinen menetelmä käsiteanalyysi on kielitieteen meta- 
teoriassa, jossa tutkimuksen kohteena ovat erilaiset kieliteoriat, keske- 
nään kilpailevat ja koulukuntakiistoja synnyttävät näkemykset tai jokin 
akateeminen keskustelu esimerkiksi jostakin valitusta keskeiskäsitteestä 
(ks. esim. Hamunen, Nieminen, Kelomäki & Dufva 2019). Kun selvite- 
tään tietyn kieliryhmän, aikakauden, tekstilajin tai ajattelijan käyttämiä 
merkityksiä, käsitteiden analyysi, vertailu ja määrittely on usein pää- 
metodi. Käsitteiden alkuperän, muutosten, historian, kielellisen alku- 
perän ja tekstilajittaisen variaation tarkastelu kuuluu kielitieteeseen, ja 
käytössä on silloin usein käsiteanalyysi. Käsiteanalyysia käytetään myös 
semantiikassa silloin, kun tutkimuksen kohteena on yksi koherentti 
tekstikokonaisuus, jonka sisältöä analysoimalla voidaan konstruoida 
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käytetyn käsitteen tai käsitteistön merkityssisältö. Myös diskurssi- 
analyysissa ja leksikaalisessa semantiikassa voidaan toisinaan sovel- 
taa käsiteanalyysia, kun selvitellään jonkin tietyn käsitteen tarkoitusta 
käyttöyhteyden valossa. 


4. Käsiteanalyysin tavoitteet tutkimuksessa 


Tutkimuksessa käsiteanalyysi voi olla useassa roolissa. Esimerkiksi 
haastattelututkimuksessa voidaan käsiteanalyysia käyttämällä abstrahoi- 
da vastauksista uusi käsite (ks. Haastattelu aineistonkeruun metodina 


sosiolingvistiikassa tässä kirjassa). Käsite voi siten olla tutkimuksen tu- 
los. Tällöin ajatellaan, että käsiteanalyysin tavoitteena on reaalimääritel- 


mä, sillä sen tavoite on kuvata reaalitodellisuutta ja tutkimuksen tulosta 
tarjotaan muille tutkijoille kehitettäväksi ja testattavaksi. Reaalimääri- 
telmä koskee faktuaalisia seikkoja, ja se eroaa nominaalimääritelmästä, 
joka käsittelee verbaalisia sopimuksia. Reaalimääritelmä voi olla tosi 
tai epätosi, nominaalimääritelmä ainoastaan enemmän tai vähemmän 
käyttökelpoinen. 

Tietty käsitteen määritelmä voi olla myös hypoteesi, jota tutkimuksen 
kuluessa testataan, kehitetään tai jäsennetään aineiston valossa. Tällöin 
tutkimuksen tavoitteena on usein käsitteen deskriptiivinen määritelmä 
eli yksityiskohtainen kuvaus käsitteen moninaisesta käytöstä. Päämää- 
ränä on kartoittaa käsitteen yhteyksiä muihin käsitteisiin, teksteihin ja 
teorioihin. 

Deskriptiiviselle käsitetutkimukselle vastakkainen tavoite on yleen- 
sä kokeellisella tutkimuksella, jossa käsiteanalyysia käytetään rikkaan 
määritelmän supistamiseen: tavoitteena on tuottaa havaintotermein 
lausuttu kausaalinen ja semanttisesti köyhä operationaalinen määritel- 
mä, jota voidaan käyttää kokeena tai josta voidaan konstruoida kokeel- 
linen tutkimusasetelma. Havaintotermi viittaa välittömästi havaittaviin 
ominaisuuksiin tai suhteisiin, ja niiden avulla yleensä määritellään tut- 
kimuksessa mitattavat yksiköt (Konstenius 2014). Jako havaittaviin ja 
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abstrakteihin termeihin voidaan ymmärtää myös Searlen (1995) erotte- 
lun avulla: värikäs paperilappu on havainnon ulottuvilla eli karkea fakta 
(engl. brute fact), kun taas tulkinta, että paperilappunen on rahaa ja sillä 
on arvo, on institutionaalinen fakta (engl. institutional fact). 

Filosofisen käsiteanalyysin päämääränä on vuorostaan koetella kä- 
sitettä tai falsifioida analyysin kohteena oleva käsite. Tässä kehyksessä 
pyritään hylkäämään tai vahvistamaan käsitteitä niiden loogisten omi- 
naisuuksien perusteella. Käsitettä koskevien loogisuusvaatimusten eli 
käsitteen taustaoletusten ja kategoriaoletusten on oltava keskenään 
ristiriidattomat. Sisäisesti ristiriitaiset käsitteet hylätään, koska niillä ei 
ole totuusarvoa. Totuusteoreettiset tavoitteet johtavat filosofisessa tutki- 
muksessa käyttämään käsiteanalyysin rinnalla informaalia ja formaalia 
logiikkaa, ajatuskokeita ja argumentaatioanalyysia. 


5. Tutkimuksen vaiheet 


Tässä luvussa selostetaan tiiviisti käsiteanalyyttisen menetelmän vaiheet 
ja kulku. Esitystä havainnollistetaan kuvitteellisella esimerkkitutkimuk- 
sella. 


1. Tutkimuskohde 
Käsiteanalyysi alkaa tutkimuskohteen eli tutkittavan käsitteen valinnalla. 


Esimerkkitutkimuksessa päätämme tutkia Eleanor Roschin (1973) 
käsitettä PROTOTYYPPI. 


2. Näkökulma 

Tutkimuskohteen valinnan jälkeen pohditaan, mikä voisi olla tutkimuk- 
sen anti tai se ajankohtainen tieteellinen kysymys, johon voidaan vastata 
tutkimalla valittua käsitettä. 
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Lahestymme Roschin PRororvypP1-käsitettä siitä näkökul- 
masta, onko kognitiivisen kieliopin määritelmä (erityisesti 
Langackerin [1987] tulkinta prototyypistä) uskollinen Roschin 
PROTOTYYPPI-käsitteelle. 


3. Analyysin tavoitteiden määrittely 

Kun tutkimuksen näkökulma on tarkennettu, on aika määritellä tutki- 
muksen tarkemmat tavoitteet. Tavoitteet voidaan muotoilla tutkimus- 
kysymyksen muotoon. 


Esimerkkitutkimuksemme tavoitteena on tuottaa tuore näkemys 
siitä, millä tavoin kognitiivisen kieliopin terminologia on yhtene- 
väinen Roschin teorian kanssa. 


4. Aineiston valinta 

Käsiteanalyysissa tarkastellaan useimmiten yhden kirjoittajan tekstiä tai 
jonkin jollain mittapuulla yhtenäisen ryhmän kirjoituksia kerrallaan, 
jotta rakentuisi koherentti käsitys käsitteestä. Käsite on aina osa laajem- 
paa käsitejärjestelmää, minkä vuoksi käsitteen merkitys on ymmärret- 
tävissä vasta, kun tutkimuksen kuluessa on selvitetty tutkitun käsitteen 
suhde taustakäsitejärjestelmän muihin käsitteisiin. Oleellista on valita 
sellainen yhtenäinen aineisto, jossa voidaan olettaa olevan yksi yhtenäi- 
nen käsitejärjestelmä tai joka edustaa tietyn kieliryhmän kielenkäyttöä. 
Käsiteanalyysissa syvyys ja tarkkuus ovat hyveitä — ei määrä! 


Koska esimerkkitutkimuksessamme tarkastelemme kognitiivisen 
kieliopin terminologiaa verrattuna Roschin teoriaan (erityises- 
ti Langackerin [1987] tulkintaa prototyypistä suhteessa Roschin 
prototyyppi-käsitteeseen), tarvitsemme aineistoa molemmista teo- 
rioista. Valitsemme kohdeaineistoksi Langackerin teoksen Founda- 
tions of Cognitive Grammar (1987) sekä Roschin (1973-1999) re- 
levantin tuotannon, jotta saamme kuvan PROTOTYYPPI-käsitteen 
muutoksista hänen kirjoituksissaan. 
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5. Tekstin esiymmärrys 

Lähdetekstien hyvä tuntemus on käsiteanalyysin edellytys. Käsite- 
analyysi pohjaa tietoon tekstin aihepiiristä ja tyylilajista sekä tieteelli- 
sestä koulukunnasta ja taustalla olevista tieteellisistä kiistoista, mikäli on 
kyse tieteellisestä tekstistä. Tekstin tausta ja ajassa käytetyt muut merki- 
tykset muodostavat merkitysmatriisin valitun käsitteen rekonstruktiolle. 
Menetelmä perustuu siis viime kädessä tekstin tulkintaan, ja sillä on 
pyrittävä vastaamaan mm. seuraaviin kysymyksiin: Mihin kysymykseen 
teksti vastasi kirjoittajan aikalaisille? Mitä tutkittava käsite merkitsi ai- 
kalaisille arkikielessä tai tieteessä? 


Esimerkkitutkimuksessamme tämä tarkoittaa sitä, että kartoitetaan 
kognitiivisen kieliopin syntyhistoriaa ja ne formalismia vastustavat 
käsitykset, jotka koulukunta on esittänyt, pitäen mielessä forma- 
lismi-funktionalismi-eronteon dikotomisen rakenteen. Lisäksi 
kartoitetaan Roschin akateeminen konteksti psykologiassa (be- 
haviorismi, kehityspsykologiset trendit jne.) sekä Wittgensteinin 
esittämän PERHFYHTÄLÄISYYS-käsitteen vaikutus Roschin tutkimus- 
asetelmien arkkitehtuuriin. 


6. Edeltävän epätietoisuuden tunnistaminen 

Käsitteen merkityksen analyysi ja rekonstruktio edellyttävät käytettyjen 
ilmausten merkitysten tunnistamista ja ymmärtämistä aineistossa. Siksi 
on oleellista kiinnittää huomiota itselleen tuntemattomien merkitys- 
ten esiintymiseen tekstissä ja tutkimuksen kuluessa pohtia, kasvaako 
ymmärrys tekstin hankalista kohdista ja miten tuntemattomiksi jäävät 
merkitykset vaikuttavat luotettavaan käsitteen rekonstruktioon. 


Esimerkkitutkimuksessamme varmistamme tässä kohden, että 
ymmärrämme, mitä Rosch tarkoittaa peruskategorioilla. 


7. Prosessin suunta 

Käsitettä lähestytään tekstin sisäisestä käsitejärjestelmästä käsin, her- 
meneuttisessa kehässä, tulkiten merkityksiä aina laajempia taustakäsite- 
järjestelmiä vasten. Tekstistä haetaan tulkinta-apua käsitteen merkitys- 
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ten analyysiin ja rekonstruktioon. Tutkimuksen kuluessa ymmärrys 
tekstistä paranee. 


8. Käsitteen esiintymien indeksointi teksti-, tilanne-, asia- ja käyttö- 
yhteyksissään 

Esiintymä (engl. token) on käsitteen konkreettinen esiintyminen jossa- 
kin kielellisessä yhteydessä. Käsitteen tehtävää ja roolia analysoidaan 
näissä teksti-, tilanne-, asia- ja käyttöyhteyksissä. Käytännössä käsitet- 
tä tulkitaan erikseen jokaisessa käyttöyhteydessään ja suhteessa asia- 
yhteyteen, minkä jälkeen tehdään päätelmiä tekstiyhteydestä. Tarpeel- 
lista on myös koota ne yhteydet, joissa käsite ei esiinny mutta jotka ovat 
samankaltaisia kuin ne, joissa käsite esiintyy. Nämä voivat lisätä tietoa 
käsitteen merkityksestä tai kertoa kategorioiden rajoista. 


Havainnollistamme käsitevertailun rakennetta ja luonnetta poimi- 
malla tarkasteluun esimerkkitutkimuksestamme yhden konkreet- 
tisen esiintymän, Langackerin (1987, 142) lauseen ”Certain types 
of nominals are clearly more prototypical than others”. Vertaamme 
lauseen tulkintaa Roschin vastaavan käsitteen määritelmiin. Jat- 
kamme analyysia Langackerin prototyyppi-sanan ja sen johdosten 
esiintymälöydöksistä suhteessa Roschin tutkimuksiin. 


9. Analyyttisten kysymysten esittäminen aineistosta (ks. myös Haarala 
1981) 
— Annetaanko käsitteelle reaali- tai nominaalimääritelmiä tekstissä? 
— Liittyykö määrittelyyn havainnollisia esimerkkejä? 
— Mitkä ovat käsitteen lähisynonyymit, ja mitä merkityseroja näillä 
on keskenään? 
— Onko käsitteellä sukua tai yläluokkaa? 
— Onko käsitteellä alaluokkia? 
— Onko käsitteellä ominaisuuksia? 
— Mikä tehtävä käsitteellä on asiayhteydessään? 
— Onko käsitteellä tehtäviä ihmisten välisessä kommunikaatiossa? 
Kuuluuko käsite tietylle ryhmälle? 
— Onko käsitteellä ajallisia ominaisuuksia tai prosessin osia? Onko 
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käsite itse osa jotakin prosessia tai kokonaisuutta? 

— Millaisen todellisuuden käsite olettaa? Millaisia toimijoita, olemas- 
saolon tasoja tai systeemejä se implikoi? 

— Mitkä ovat käsitteeseen liittyvät muut käsitteet? 

— Millä muilla käsitteillä tämän käsitteen ominaisuuksia, osia tai nii- 
den puutteita kuvaillaan? 


10. Synteesi 
Analyysin tuloksista muodostetaan käsitteen kuvauksen synteesi, joka 
on argumenttien koherentti ja looginen kokonaisuus. Sen päämäärä- 
nä on käsitettä koskeva teorianmuodostus. Kun käsitteen esiintymät 
on analysoitu, tulkintaa pyritään yhtenäistämään. Samaa merkitsevät 
ilmaukset pyritään sanomaan yhdellä ilmauksella. Käsitteiden tehtävä- 
nä on luokittelemalla ryhmittää olioiden yhteisiä piirteitä. Siksi käsite- 
analyysin tulos eli käsitteen sisältö (intensio) on yleisten piirteiden 
joukko. On myös tarkasteltava, onko tekstissä käytetty käsite yksimer- 
kityksinen, vertailemalla keskenään eri esiintymien analyysien tulok- 
sia. Ovatko analysoitujen esiintymien kategoriaoletukset ja ontologinen 
taustateoria yhteneväiset eli loogisesti johdonmukaiset? Lausejoukko 
on ristiriitainen, jos kaikki lauseet eivät voi olla samanaikaisesti tosia. 
Mikäli osoittautuu, että käsitteellä on keskenään eriäviä taustaoletuksia, 
tulee pohtia, onko käsite sisäisesti ristiriitainen vai nimeääkö jokin ter- 
mi paikoitellen eri käsitteitä. Tulee selvittää 
— onko analyysin yhtenäisyyttä erottaville merkitystekijöille selityksiä 
tekstissä 
— mitkä ovat esiintymien analyysien yhteiset ja mitkä erottavat 
merkitystekijät 
— voiko yhdistävistä tekijöistä muodostaa käsite- tai merkitysperheen 
perusmääritelmää 
— voiko perusmääritelmää täydentää muilla käsitteillä ja näin selittää 
tekstissä esiintyviä käsitteen käytössä ilmeneviä merkityseroja. 


Toisinaan nuorilla käsitteillä on perheyhtäläinen rakenne: yksi termi ni- 
meää useaa lähikäsitettä tai hierarkkisia käsitteitä. Tällöin tulee selvittää 


— mitkä ovat välttämättömät ja riittävät ehdot käsitteen käytölle 
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— mikä on käsitteen ekstensio 
— sopiiko yksi käsitteen käytön normatiivinen rekonstruktio kaikkiin 
aineiston esiintymiin. 


Perusmääritelmän ja ekstension alaa verrataan muihin käsitejärjes- 
telmän käsitteisiin ja yleiseen rakenteeseen ja todetaan, esiintyykö 
ristiriitaisuuksia tai päällekkäisyyksiä. Lähikäsitteitä, rajatapauksia ja 
vastaesimerkkejä tutkimalla voidaan tarkentaa, mitä tutkittava käsite ei 
ole. Koska lähikäsite muistuttaa analysoitavaa käsitettä merkitysraken- 
teeltaan, erottavat tekijät ovat usein merkittäviä kokonaisteorian näkö- 
kulmasta ja siksi myös osa merkitysmatriisia. Merkitysmatriisi osoittaa, 
miten analysoitava käsite sijoittuu suhteessa ympäröiviin käsitteisiin. 
Lopuksi tutkitaan argumentaatioanalyysin avulla, onko käsitteen re- 
konstruktiolla loogisia implikaatioita tai taustaoletuksia, kun sen sijoittaa 
takaisin tekstiyhteyksiinsä. Mikäli rekonstruoitu käsite aiheuttaa risti- 
riitaisuuksia tekstiin, tunnistetaan ja eksplikoidaan ristiriita. Käsitteen 
analyysi ja tulkinta on riittävä, kun rekonstruoitu käsite, teksti ja käsite- 
järjestelmän eri osat muodostavat ilmeisen yhtenäisen kokonaisuuden. 


6. Yhteenveto 


Käsiteanalyysi on metodina osa kaikkea tieteellistä tutkimusta, sillä tietees- 
sä täsmennämme käyttämiämme käsitteitä. Metodilla on kuitenkin erityi- 
nen rooli kielitieteessä silloin, kun tutkimuksessa on tarve jäsentää jonkin 
käsitteen täsmällinen merkityssisältö tekstissä. Se, mitä käsiteanalyysin tu- 
loksen viime kädessä uskotaan kuvaavan, riippuu vuorostaan taustalla ole- 
vasta merkitysteoriasta. Joidenkin teorioiden mukaan käsitteet ovat mie- 
lessä, toisten näkemysten mukaan ne konstruoidaan tekstikontekstissa ja 
kolmansien mukaan niillä on käsitteen sisäiseen rakenteeseen perustuva 
itsenäinen viittaussuhde maailmaan. Konkreettisen tekstianalyyttisen 
käsiteselvittelyn rinnalla on siis tärkeää hahmottaa myös käsitteen meta- 
teoreettinen asemoituminen johonkin tieteelliseen taustaan. 
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Mika? 


Korpuksella tarkoitetaan kielentutkimuksessa laajaa sähköisessä muo- 
dossa olevaa tietokoneluettavaa tekstikokoelmaa, joka on strukturoitu 
ja edustava tutkimuksen tarpeita palvelevalla tavalla. Korpus voi sisäl- 
tää erilaisia hyödyllisiä lisätietoja, kuten sanaluokkakoodeja tai lauseen- 
jäsennyksen. Kukin korpuksen tekstikatkelma alkaa yleensä metatiedoil- 
la, joista selviää esimerkiksi tekstin kirjoittaja tai puhujat, tekstilaji ja 
tekstin tuottamisen ajankohta. Näiden merkintöjen avulla korpuksesta 
voidaan tehokkaasti tehdä erilaisia automatisoituja hakuja. 


Katso myös: 
Luku 7 Laadullinen aineistopohjainen kielentutkimus 
Luku 10 Määrällinen korpuslingvistiikka 


Luku 11 Historiallinen korpuslingvistiikka 
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1. Johdanto 


Korpukset ovat nykyaikaisessa kielentutkimuksessa keskeinen aineisto- 
tyyppi, sillä ne tarjoavat tutkijalle empiiristä aineistoa kielenkäytöstä. 
Niiden avulla voidaan vastata monenlaisiin tutkimuskysymyksiin, testata 
kielenkäyttöä koskevia hypoteeseja ja tarkistaa esimerkiksi, kuinka tiet- 
tyä sanaa käytetään. Tyypillisesti korpuksista saadaan tavalla tai toisella 
kielestä määrällistä tietoa, jollaista kielen käyttäjien intuitio ei tavoita 
(ks. Määrällinen korpuslingvistiikka tässä kirjassa). Korpukset soveltuvat 
kuitenkin myös laadullisten tutkimusten aineistoksi (ks. Laadullinen 
aineistopohjainen kielentutkimus tk.). 

Korpukset ovat tutkijan kannalta nopea keino saada tutkimuksessa 


tarvittava aineisto, sillä monista kielistä on jo olemassa eri tarkoituksiin 
koottuja valmiita korpuksia. Oman korpuksen kokoaminenkin voi tun- 
tua helpolta ja houkuttelevalta vaihtoehdolta erityisesti, jos aineisto on 
jo valmiiksi sähköisessä muodossa esimerkiksi netissä. Korpuksen ko- 
koaminen on kuitenkin aina muutakin kuin vain tekninen ”imurointi- 
suoritus”, ja varsinkin aloittelevan korpustutkijan kannattaa ensin sel- 
vittää, millaisia korpuksia on valmiiksi saatavilla. Keskeistä on miettiä, 
mihin kysymyksiin korpuksella pyritään vastaamaan ja mitä edellytyksiä 
tämä puolestaan asettaa aineistolle. 

Tässä artikkelissa valotamme ensin luvussa 2 lyhyesti korpusten his- 
toriaa ja korpustutkimuksen taustalla olevaa kielikäsitystä ja muita teki- 
jöitä. Luvussa 3 esittelemme valmiina saatavilla olevia aineistoja ja luvus- 
sa 4 taas tarkastelemme korpusten koostamisessa huomioon otettavia 
seikkoja. Luvussa 5 esittelemme Kielipankin Korp-käyttöliittymän avulla, 
miten korpustyökalut toimivat. Lopuksi pohdimme vielä korpustutki- 
muksen viimeaikaista kehitystä, ns. big datan synnyttämiä uusia meto- 
dologisia kysymyksiä ja korpustutkimuksen rajoitteita ja sudenkuoppia. 
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2. Korpustutkimuksen taustaa 


Vaikka periaatteessa mikä tahansa systemaattisesti koottu tekstikokoel- 
ma voi muodostaa korpuksen, korpuksella tarkoitetaan yleensä nimen- 
omaan tietokoneluettavaa tekstiaineistoa. Korpuslingvistiikan synty 
nivoutuukin yhteen tietotekniikan kehityksen kanssa. Tärkeä merkitys 
on ollut myös kielitieteen kehityksellä, sillä viimeistään 1980-luvulta 
alkaen on tukeuduttu yhä enenevässä määrin aineistopohjaisiin, em- 
piirisiin menetelmiin muun muassa generatiivisen kielentutkimuksen 
lähes yksinomaisesti käyttämän introspektion eli kielitajun lisäksi (ks. 
Kielitaju kielentutkijan työkaluna tk). 

The Brown Corpus of Contemporary American English,’ joka julkais- 


tiin vuonna 1964 Brownin yliopistossa Yhdysvalloissa, oli ensimmäisiä 
tietokoneluettavia korpuksia. Se sisältää miljoona sanaa vuonna 1961 
kirjoitettua amerikanenglantia ja koostuu 500:sta eri tekstikategorioita 
edustavasta 2 ooo sanan otoksesta. Nykymittapuulla Brown-korpus on 
varsin pieni, mutta sitä käytetään tutkimuksessa edelleen. 

Hyödylliseksi Brown-korpuksen tekee se, että muita korpuksia on 
koottu vastaavalla sapluunalla, kuten vuoden 1961 brittienglantia edus- 
tava Lancaster-Oslo-Bergen (LOB) Corpus. Lisäksi alkuperäisten Brown- 
ja LOB-korpusten verrokit, 1990-luvun alun englantia edustavat Frown: 
ja F-LOB^ sekä 1930-luvun englantia edustavat B-LOB-1937 ja B-Brown”, 
mahdollistavat sekä ajallisen että maantieteellisen vertailun. Tällainen 
aineistojen yhteismitallisuuden ja vertailtavuuden lisääminen voisi ylei- 
semminkin olla paikallaan tutkimuksen läpinäkyvyyden ja toistettavuu- 
den sekä tiedon kumuloitumisen kannalta. 

Myös Suomessa korpustutkimus lähti vauhtiin aikaisessa vaihees- 
sa. Oulun yliopistossa laadittiin jo 1960-luvulla suomen kielen Oulun 
korpus”, jonka perusteella Pauli Saukkonen (1977) laati muun muassa 
suomen kielen sanojen yleisyystilaston. Turun yliopistossa sähköisiä 
teksti- ja ääniaineistoja tarjoava Lauseopin arkisto? aloitti toimintansa 
niin ikään 1960-luvulla. Se sisältää sekä puhutun että kirjoitetun kielen 
aineistoja, kuten kaikki Suomen murrealueet kattavan murrekorpuk- 
sen, arkikeskusteluja sisältävän Arkisyn-korpuksen, Mikael Agricolan 
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teoksia, vieraskielisten kirjoittamaa suomea käsittävän Edistyneiden 
suomenoppijoiden korpuksen ja akateemiseen suomeen keskittyvän 
Akateeminen suomi -korpuksen. Monet näistä on morfosyntaktisesti 
koodattu niin, että korpuksesta tehtävät haut voidaan kohdistaa esi- 
merkiksi kieliopillisena subjektina toimiviin sanoihin. Helsingin yli- 
opistossa oivallettiin kehittyvän tietotekniikan mahdollisuudet kielen- 
tutkimuksessa 1980-luvulla, jolloin koottiin noin 1,5 miljoonaa sanaa 
historiallista englantia sisältävä The Helsinki Corpus of English Texts,’ 
joka Brownin ja LOBin tavoin sisältää näytteitä eri tekstilajeista ja joka 
ulottuu muinaisenglannin kaudelta varhaisuusenglantiin eli noin vuo- 
desta 730 vuoteen 1710. Helsinki Corpus oli ensimmäinen historiallisen 
englannin kattava korpus, ja alan tutkijat käyttävät sitä edelleen. 

Alkuaikojen korpustutkimus liittyi erityisesti variationistiseen lä- 
hestymistapaan, jossa pyrittiin selvittämään, kuinka kielen vaihtelua 
ja muutosta voidaan ymmärtää systemaattisesti ja kuinka näennäises- 
ti sattumanvaraisia kielellisiä valintoja voidaankin selittää erilaisten 
kielenulkoisten ja -sisäisten muuttujien avulla (ns. orderly heterogeineity; 
Weinreich, Labov & Herzog 1969). Tällaiseen tutkimukseen korpus on 
välttämätön työkalu, koska se tarjoaa riittävän määrän systemaattisesti 
järjesteltyä aineistoa, josta voidaan helposti hakea ja laskea kielen piir- 
teiden frekvenssejä. Korpustutkimus yhdistyy edelleenkin vahvasti mää- 
rällisiin menetelmiin ja pyrkimykseen selvittää kielen systematiikkaa, 
mutta nykyisin myös monet tavallisesti laadullisia menetelmiä soveltavat 
kielentutkimuksen suuntaukset, kuten diskurssintutkimus ja pragma- 
tiikka, hyödyntävät korpuksia. 

Viime vuosikymmenen trendejä korpusrintamalla onkin ollut juuri 
korpusten käytön leviäminen erilaisten tutkimusperinteiden osaksi (ks. 
Käännöstiede ja sen menetelmät tk.). Lisäksi erilaiset erikoiskorpukset, 
puhutun kielen korpukset ja aina vain isommat korpukset ovat lisäänty- 


neet, ja myös korpustyökalut, kuten klusteri- ja avainsana-analyysi sekä 
muut määrälliset menetelmät, ovat kehittyneet tietojenkäsittelytieteen 
ja korpuslingvistiikan tutkijoiden yhteistyön myötä (ks. Määrällinen kor- 
puslingvistiikka; Historiallinen korpuslingvistiikka tk.). 

Suomessa korpusten käyttöä on tukenut ja edistänyt FIN-CLARINin 
perustaminen 2000-luvulla. FIN-CLARIN on suomalaisten yliopistojen, 
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CSC:n ja Kotimaisten kielten keskuksen eli Kotuksen muodostama 
konsortio, jonka tehtävänä on auttaa esimerkiksi kielentutkijoita käyttä- 
mään, säilyttämään ja jakamaan aineistoja. FIN-CLARIN ylläpitää Kieli- 
pankkia,” jonka kautta tutkijat voivat käyttää laajaa valikoimaa valmiita 
aineistoja ja myös esittää omia aineistojaan liitettäviksi kokoelmiin mui- 
den käytettäviksi. 

Tulevaisuuden korpuksissa voisi ajatella eri modaliteettien, kuten 
tekstin, äänen ja kuvan, sekä metadatan olevan tutkijan helposti saata- 
villa siten, että niistä voidaan tehdä ristikkäisiä hakuja ja erilaisia visua- 
lisointeja esimerkiksi kaavioiden, karttojen tai animaatioiden muodos- 
sa. Näin tulevaisuuden korpustyökalu voisi esimerkiksi havainnollistaa 
automaattisesti vaikkapa tietyn ajankohtaisen sanan, kuten ihgu tai 
maahanmuutto, yleistymistä ajan myötä tai sijoittaa kartalle aineistossa 
havaittujen murresanojen käyttöä. 


3. Erilaisia korpuksia 


1960-luvun alun jälkeen korpusten koostamisesta on tullut yhä helpom- 
paa ja yleisempää, ja nykyään erilaisia aineistoja on valtavasti saatavilla. 
Näitä aineistoja voidaan ryhmitellä eri tavoin niiden kokoamisperiaat- 
teiden, käyttötarkoituksen ja niiden sisältämien metatietojen mukaan. 
Metatiedot ovat korpukseen konelukuisessa muodossa lisättyjä 
merkintöjä esimerkiksi korpuksen tekstien kirjoittajista, kirjoitusajan- 
kohdasta tai -paikasta tai vaikka puheen prosodiasta. Metatietojen li- 
säämisestä puhutaan vaihtelevasti joko koodauksena tai annotointina. 
Tavallinen esimerkki kieliaineistossa on morfologia- tai syntaksianno- 
toinnit tai -koodaukset, mutta periaatteessa tekstiin voidaan annotoi- 
da mitä tahansa tietoja, jotka katsotaan hyödyllisiksi (ks. Määrällinen 
korpuslingvistiikka; Laadullinen aineistopohjainen kielentutkimus tk.). 
Oleellista on, että annotoinnit ovat koneellisesti luettavassa muodossa. 


Näin niitä voidaan käyttää hyväksi koneellisessa analyysissa sekä korpus- 
hakuja tehtäessä. 


464 VERONIKA LAIPPALA JA MINNA PALANDER-COLLIN 


Metatietoja voidaan lisätä joko käsin tai koneellisesti jonkin ohjelman 
avulla riippuen siitä, mitä metatietoja korpukseen halutaan ja kuinka 
luotettavia niiden pitää olla. Esimerkiksi korpuksen sanaluokat voidaan 
monissa tapauksissa tunnistaa automaattisesti riittävällä tarkkuudella. 
Erityisesti yleiskielelle sanaluokkien tunnistus toimii varsin hyvin, vaikka 
puheenomaista kieltä tai murteita sisältävien tekstien sanaluokkien tunnis- 
taminen vaatii vielä kehittämistä. Aineistot vaihtelevat sen mukaan, kuinka 
paljon metatietoa ne sisältävät. Toiset aineistot voivat sisältää hyvin yksi- 
tyiskohtaiset merkinnät, kun taas toisissa ei ole juurikaan lisättyä tietoa. 

Esimerkkinä metatietojen koodaamisesta niin sisällölliseltä kuin tek- 
niseltäkin kannalta voi tutustua avoimesti verkossa saatavilla olevaan 
Anni Sairion kokoamaan 1700-luvun yksityiskirjeenvaihtoa sisältävään 
Bluestocking Corpukseen", jonka metatiedot löytyvät sekä erillisestä 
excel-tiedostosta että xml-koodattuina tekstitiedostoista. 

Ryhmittelemme alla aineistoja erilaisiin korpustyyppeihin, jotta lukija 
voi ryhtyä pohtimaan, miten olemassa olevat aineistot voisivat palvella 
hänen tutkimuksensa tarpeita. 


3.1. Yleiskorpukset 


Näiden korpusten tavoitteena on kuvata kieltä yleisellä tasolla, ja tavalli- 
sesti ne pyritäänkin koostamaan eri lähteistä niin, että ne olisivat mah- 
dollisimman kattavia. Monet näistä korpuksista ovat kansalliskorpuksia 
(engl. national corpora). Tämä tarkoittaa, että ne kuvaavat jonkin maan 
kieltä, kuten vaikka British National Corpus” englantia tai Venäjän kan- 
salliskorpus® venäjää. 


3.2. Synkroniset aineistot 

Synkronisia aineistoja käytetään tavallisesti kuvaamaan kielessä ilmene- 
vää vaihtelua jonakin tiettynä ajankohtana. Näiden avulla voidaan vertail- 
la, miten kieltä käytetään esimerkiksi eri alueilla. Tyypillinen esimerkki 


on The International Corpus of English (ICE), joka on suunniteltu 
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eri englannin varieteettien tutkimiseen. Se sisältää 20 miljoonan sanan 
alakorpusta, joista jokainen edustaa jotain englannin maantieteellistä 
varieteettia, kuten Australia, Hong Kong tai USA. Vertailun helpottami- 
seksi jokainen alakorpus on koostettu samoilla kriteereillä, ja niissä on 
samankaltaiset kielioppimerkinnät. 


3.3. Diakroniset aineistot 


Diakronisia aineistoja käytetään kielen vaihtelun ajalliseen tarkasteluun, 
eli niistä tutkitaan, miten kieli on muuttunut jonkin ajan kuluessa. 
Esimerkki diakronisesta korpuksesta on edellä mainittu The Helsinki 
Corpus of English Texts, joka kattaa noin tuhat vuotta englantia. 
Diakronisista aineistoista kerrotaan enemmän tämän teoksen luvussa 
Historiallinen korpuslingvistiikka. 


3.4. Puhutun kielen aineistot 


Sen lisäksi, että yleiskorpuksissa on omat osionsa puhutulle kielelle, 
on myös aineistoja, jotka sisältävät ainoastaan puhuttua kieltä. The 
London-Lund Corpus (LLC)5 on ensimmäinen elektroninen spontaa- 
nin puheen korpus. Se sisältää 500 ooo sanaa puhuttua brittienglantia. 
Aineisto on kirjoitettu puhtaaksi eli litteroitu, ja siinä on mukana varsin 
yksityiskohtaiset merkinnät tekstin prosodiasta. 

Myös Suomessa on kerätty monia puhutun kielen aineistoja. Esimer- 
kiksi yllä jo mainittiin arkikeskusteluja sisältävä Arkisyn ja Lauseopin 
arkiston murrekorpus, jotka molemmat on kieliopillisesti koodattu eli 
niihin on merkitty sanojen ja virkkeiden morfologisia ja syntaktisia 
ominaisuuksia. Lisäksi Lauseopin arkistolla ja Kotimaisten kielten kes- 
kuksella on koottuna äänitteitä, joita ei ole kaikkia litteroitu: Kotuksen 
Suomen kielen nauhoitearkisto sisältää noin 24 ooo tuntia äänitteitä 
suomen murteista, ja Lauseopin arkiston äänitearkiston aineistoissa on 
muun muassa murrehaastatteluja ja luentojen, kokousten yms. tilai- 
suuksien nauhoitteita. 
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3.5. Puupankit eli syntaksiannotoidut korpukset 


Kieliaineistoja, jotka sisältävät yleensä käsin tarkistetut syntaksi- 
merkinnät, sanotaan puupankeiksi. Puupankkeja voidaan käyttää aineis- 
toina kielentutkimuksessa. Erityisesti ne soveltuvat tutkimuksiin, joissa 
tarkastelun kohteena on jokin syntaktinen ilmiö. Syntaksimerkintöjen 
ansiosta puupankeista voi helposti hakea näitä ilmiöitä. Lisäksi puu- 
pankit ovat tarpeellisia kieliteknologiassa. Koneoppimisen avulla niiden 
pohjalta voidaan kehittää syntaksijäsentimiä eli tietokoneohjelmia, jotka 
analysoivat kielen morfologiaa ja syntaksia automaattisesti. Näitä voi 
hyödyntää korpuksen koostamisessa metatietojen lisäämiseen. 

Ensimmäinen korpus tässä kategoriassa oli amerikkalainen, vuonna 
1992 julkaistu Penn Treebank. Ensimmäinen suomenkielinen vapaasti 
saatavilla oleva puupankki on Turku Dependency Treebank (TDT), jonka 
ensimmäinen versio julkaistiin 2009. Nykyään TDT on liitetty kansain- 
väliseen Universal Dependencies -puupankkikokoelmaan, joka sisältää 
suuren määrän puupankkeja eri kielille.'ó 

Varhaisemmissa puupankeissa virkerakenne on usein merkitty lau- 
sekerakennekieliopin keinoin (ks. Tieteen termipankki sv. lauseke- 
rakennekielioppi). Nykyään syntaksi kuvataan yleensä dependenssikieli- 
opin avulla (ks. Tieteen termipankki sv. dependenssikielioppi). Tässä 


virkkeen rakenne ilmaistaan sanojen välisten riippuvuuksien keinoin. 
Virkkeen juuri on tavallisesti finiittiverbi, josta lähtee riippuvuudet mui- 
hin sanoihin. 

Kuviossa 1 finiittiverbi kootaan on virkkeen juuri. Juuresta lähtevät 
objekti (obj), adverbiaalit (nmod ja adv) ja välimerkkiä merkitsevä punct. 
Sanasta tarkoitusta lähtee vielä adjektiivimääriteriippuvuus (amod) tätä 
määrittävään adjektiiviin tiettyä ja case-riippuvuus postpositioon varten. 
Kuviossa sanojen sanaluokka- ja morfologiatiedot ovat näkyvissä vain 
sanalle tarkoitusta, ja niistä käy ilmi, että sanan sanaluokka on NOUN eli 
substantiivi, sijamuoto partitiivi, lemma eli perusmuoto tarkoitus ja luku 
yksikkö. Todellisuudessa syntaksiannotointien taustalla puupankeissa 
on vastaavat tiedot kaikille sanoille. 
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"tarkoitusta" 
NOUN 


amod punct» Case: Par 
—nrá — ——— A 
N 


z 7 > = Xpostag: Number=Si 
Korpus kootaan aina tiettyà tarkoitusta varten k Ne tip 


Kuvio 1. Dependenssisyntaksianalyysi virkkeelle. 


3.6. Internet korpuksena ja koneellisesti kootut aineistot 


Internetin kehityksen myötä digitaalisessa muodossa on helposti ja no- 
peasti saatavilla valtavat määrät tekstiä, josta voi koota kieliaineiston. 
Ensimmäisiä tällaisia koneellisesti internetistä koottuja aineistoja olivat 
WaCky Corpora -aineistot”, jotka sisältävät miljardeja sanoja usealla eri 
kielellä. Näissä aineistot on koottu rajoittamalla tekstihaku maakohtai- 
siin päätteisiin, kuten .uk tai .fr. WaCky-aineistojen jälkeen vastaavia ai- 
neistoja on koottu yhä laajemmalle kielivalikoimalle. Myös suomelle on 
Turun yliopistossa koottu, miljardeja sanoja sisältävä Finnish Internet 
Parsebank, joka on käytettävissä samasta internetkäyttöliittymästä kuin 
yllä mainittu Universal Dependencies -puupankkikokoelma.'s 

Koneellisesti kootuilla aineistoilla on monia etuja: ne ovat erittäin 
laajoja, ja ne sisältävät valtavasti kielellistä variaatiota myös tekstilajeista, 
joita käsin koottuihin aineistoihin harvoin päätyy. Toisaalta niiden käyt- 
töön kieliaineistona liittyy myös haasteita: siinä missä käsin koottujen 
aineistojen sisältö perustuu huolella pohdittuihin kriteereihin, koneel- 
lisesti kootuissa aineistoissa otetaan tavallisesti mukaan kaikki tekstit, 
jotka sisältävät tietyn vähimmäismäärän haluttua kieltä. Tämän takia 
koneellisesti kootuista aineistoista on hankala sanoa, millaista kieltä ne 
sisältävät tai mitä ne oikeastaan edustavat. Tämä pätee myös esimer- 
kiksi valtavaan Google Books -aineistoon, jota voi hakea Google Ngram 
Viewer -ohjelman avulla.'9 
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4. Korpuksen kokoaminen 


Jos valmiit aineistot eivät sovellu oman tutkimuksen tarpeisiin, tutkija 
voi päättää koota oman korpuksensa. Korpusta koottaessa on kuitenkin 
tärkeää muistaa, että korpus ei ole mikä tahansa kokoelma kieltä. Jotta 
korpus voisi toimia tieteellisen tutkimuksen aineistona, sen on tarkoi- 
tus edustaa jotain kieltä tai sen osaa. Tämän takia korpus kootaan aina 
johonkin tiettyyn tarkoitukseen, ja sen kokoonpanoon vaikuttavat mo- 
nenlaiset tutkimukselliset ja käytännölliset seikat. 

Korpuksen sisältö vaikuttaa tutkimuskysymyksiin, joihin sen avulla 
voidaan vastata. Esimerkiksi pelkästään radio-ohjelmia sisältävän kor- 
puksen avulla ei voi tarkastella kielen rakenteita puhutussa kielessä 
ylipäätään, tai pelkästään uutisia käsittävällä aineistolla ei voi vastata 
kysymyksiin kirjoitetun kielen kehityksestä. Usein puhutaan kriteereis- 
tä, joita asiallisesti kerätyn korpuksen tulee täyttää. Esittelemme näitä 
seuraavissa luvuissa. 

Lisäksi korpuksen kokoajan on syytä pohtia ja selvittää jo valmistelu- 
vaiheessa aineiston muotoon, säilytykseen ja jakeluun liittyviä kysy- 
myksiä, sillä nämä eivät ole vain tutkijan harkinnan varaisia seikkoja. 
Esimerkiksi aineiston säilytyksestä ja jakelusta vastaava infrastruktuuri- 
palvelu voi asettaa aineistolle omia vaatimuksiaan. Aineistoon, sen säi- 
lytykseen ja käyttöön voi liittyä myös erilaisia juridisia seikkoja, kuten 
tekijänoikeus- ja tietosuojakysymyksiä (ks. Johdannon luku 1 tk.). Pa- 
laamme näihin lyhyesti tämän luvun lopussa. 


4.1. Edustavuus 


Nykykieltä tutkittaessa on harvinaista, että tutkimuksen kohteena olevaa 
kieltä tai sen osaa voitaisiin tutkia kokonaisuudessaan. Esimerkiksi, jos 
tutkimuksen kohteena on jokin tietty rakenne kirjoitetussa nykysuomes- 
sa, korpuksena on mahdotonta käyttää kaikkia tekstejä, joita suomeksi 
on kirjoitettu. Tämän takia tutkimuksessa käytetty korpus on käytännös- 
sä aina otos tutkimuksen kohteena olevasta kielestä tai sen variantista. 
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Siksi kerätyn aineiston pitää edustaa sitä mahdollisimman hyvin. Ai- 
noastaan tällä tavalla tutkimustulokset voidaan yleistää, eli niiden voi- 
daan ajatella koskevan paitsi tutkimusaineistoa myös sen edustamaa 
kielivarianttia yleensä. 

Edustavan otoksen laatiminen on varsin haastavaa, eikä siihen ole 
yhtä oikeaa vastausta. Tärkeää on sisällyttää korpukseen mahdollisim- 
man laaja valikoima erilaisia kielenkäyttötilanteita siitä kielestä tai sen 
osasta, jota korpuksen halutaan edustavan. Tavallisesti edustavuuden 
asettamat haasteet ratkaistaan koostamalla aineisto alakorpuksista, jotka 
edustavat jotain tiettyä tekstilajia tai kielenkäyttötilannetta. Esimerkiksi 
yleiskorpus British National Corpus on hierarkkisesti koostettu niin, että 
aineisto on ensinnäkin jaoteltu puhuttua ja kirjoitettua kieltä käsittäviin 
osioihin, jotka taas koostuvat erillisistä alaosioista, kuten faktapohjaiset 
tekstit aiheesta vapaa-aika (engl. informative: leisure) ja faktapohjaiset 
tekstit aiheesta taide (engl. informative: arts). Samankaltaisia jaotteluita 
käytetään myös niin sanotuissa erityisalojen korpuksissa, kuten vaikka 
oppijoiden kieltä sisältävissä aineistoissa. Esimerkiksi LAS2 — Edisty- 
neiden suomenoppijoiden korpus sisältää tenttivastauksia, tutkielma- 
tekstejä ja esseitä. 


4.2. Koko 


Yleinen pohdinnan aihe korpusta koostettaessa on sen koko. Onko suu- 
rempi aina parempi? Mikä on riittävää? Onko ylärajaa? Jos aineisto on 
liian pieni, siitä saatavat tulokset voivat olla vääristyneitä, mutta isokin 
aineisto voi antaa kummallisen kapean kuvan kielestä. Iso korpus voi 
olla sillä tavalla vääristynyt, että se on sisällöltään kovin homogeeninen. 
Esimerkiksi lähinnä tiettyä genreä, kuten vain kaunokirjallisia tekstejä, 
sisältävä korpus tuskin kuvaa kovin hyvin kielen kirjoa. Toisaalta valtava 
aineisto voi olla teknisesti hankalakäyttöisempi kuin pieni ja näppärä 
korpus, jonka voi tallentaa omalle koneelle ja jota voi selata valmiilla 
korpusohjelmilla. 

Aineiston riittävä koko riippuu myös sen käyttötarkoituksesta. Suu- 
resta koosta on hyötyä esimerkiksi sanastontutkimuksessa, sillä monet 
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sanat ja kollokaatit eli sanojen yhteisesiintymät voivat olla hyvin harvi- 
naisia. Suuri koko on etu myös yleiskorpuksissa, kuten yllä mainitussa 
BNG:ssä, joiden tavoitteena on kuvata kieltä yleisesti. Jos yleiskorpus on 
liian pieni, se ei sisällä riittävästi kielen variaatiota ja kuvaa ainoastaan 
joitain sen yksittäisiä alaluokkia. Toisaalta tarkempiin tutkimuskysymyk- 
siin tai aihepiirin tai tiheästi esiintyvän kielellisen ilmiön tutkimiseen 
pienempikin aineisto voi olla riittävä. 

Kokoa ei myöskään mitata pelkästään aineiston sanamäärällä. Pitää 
myös pohtia, otetaanko tekstit aineistoon kokonaisuudessaan vai ainoas- 
taan osina niin, että jokaisessa luokassa on tietty sanamäärä. Lisäksi 
täytyy ottaa huomioon erilaisten tekstien määrä alaluokissa. Aineiston 
alaluokkien pitää olla tasapainossa niin, että yksikään luokka ei ole liian 
vallitseva muihin nähden. Esimerkiksi BNC:ssä kirjoitettuja tekstejä on 
kokonaisuudesta 90 % ja puhuttuja 10 %. Synkroninen eli kieltä tiettynä 
ajankohtana kuvaava The Longman/Lancaster Corpus? taas sisältää 50 
% brittienglantia, 40 % amerikanenglantia ja 10 % muita variantteja, 
kuten australian-, afrikan- ja irlanninenglantia. Tasapaino täytyy pitää 
mielessä aina yksilötasolle asti, sillä suhteettoman suuri määrä tekstiä 
yhdeltä kirjoittajalta tai puhujalta voi tuottaa tuloksia, jotka heijastelevat 
lähinnä tämän kielenkäyttäjän idiosynkraattisia piirteitä. 


4.3. Käytännön rajoitteet 


Korpuksen koostamiseen liittyy myös monia käytännön rajoitteita, jotka 
määrittävät lopputulosta eli käytettävää korpusta. Jotkin rajoitteet voivat 
olla luonnollisia; esimerkiksi historiallisilta aikakausilta ei välttämättä 
ole saatavilla tiettyjä aineistoja. Toisissa aineistoissa, kuten arkaluontei- 
sia tietoja sisältävissä potilasasiakirja-aineistoissa, saatavuus voi muuten 
olla rajoitettua. Puhuttuja aineistoja taas voi olla työläs tuottaa. 
Ainakin historiallisten kielimuotojen tutkijat ovat kirjoittaneet pal- 
jon ”huonon datan” ongelmasta, kun ennen 1900-lukua käytettyjen 
kielimuotojen tutkimus on perustunut väistämättä ainoastaan kirjal- 
lisiin lähteisiin. Koska kielellisten innovaatioiden katsotaan syntyvän 
epämuodollisessa puheessa, on tätä historiallisessa kielentutkimuksessa 
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approksimoitu esimerkiksi yksityiskirjeiden ja kirjoitetun puheen, ku- 
ten näytelmätekstien, avulla. Lienee kuitenkin parempi käyttää ole- 
massa ja saatavilla olevaa dataa kuin jättää aineistoja kokonaan käyttä- 
mättä, vaikka niiden avulla ei voidakaan vastata kaikkiin mahdollisiin 
tutkimuskysymyksiin. 


4.4. Avoin saatavuus 


Korpuksen koostaminen on työläs prosessi. Lopputulos kuitenkin palkit- 
see: valmis, huolella koostettu aineisto tarjoaa arvokasta tietoa kielestä 
ja sen käytöstä. Jotta mahdollisimman monet voisivat hyötyä tästä jo 
tehdystä työstä, kannattaa varmistaa, että valmis korpus on tallennettu 
varmaan paikkaan ja että se on mahdollisimman vapaasti saatavilla. Eri- 
tyisesti 2010-luvulta lähtien aineistojen vapaata saatavuutta onkin koros- 
tettu tutkimuksessa. Esimerkiksi Kielipankin kokoelmiin voi luovuttaa 
valmiin aineiston muiden käytettäväksi (ks. alla). Korpuksen kokoajan 
on kuitenkin varmistettava, että hänellä on lupa julkaista aineisto avoi- 
mesti kenenkään tekijänoikeuksia tai intimiteettiä loukkaamatta. Lu- 
pa-asiat ja mahdollinen aineiston metatietojen keruu kannattaa selvit- 
tää jo ennen koostamisen aloittamista. Näistä saa lisätietoa esimerkiksi 
FIN-CLARINin internetsivuilta.?" 


5. Korpustyökaluja 


Tutkijan johtotähtenä ovat aina tutkimuskysymykset, olipa aineisto mitä 
tahansa. Annamme tässä joitakin tyypillisiä esimerkkejä siitä, miten 
korpuksia voi käyttää, mutta teknistä toteutusta tärkeämpää on miettiä, 
mitä tietoa kyseiset analyysit tuottavat. 

Valmis korpus voi olla käytettävissä erilaisissa muodoissa, kuten 
tekstitiedostoina tai xml-koodattuina tiedostoina, jolloin tarvitaan vie- 
lä erillinen ohjelma tai skriptinkirjoitustaitoja korpushakuja varten. 
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Helpoin tapa useimmille tutkijoille on käyttää korpusta valmiin käyttö- 
liittymän kautta. Esimerkiksi yllä esitellyn Kielipankin aineistoja voi 
käyttää KORP-hakuliittymän? avulla (Borin, Forsberg & Roxendal 2012). 

KORP-käyttöliittymä on erittäin monipuolinen ja helppokäyttöinen. 
Ensimmäiseksi hakua tehdessään käyttäjän tulee valita halutut korpuk- 
set monipuolisesta kokoelmasta. Tässä käytämme esimerkkihaussa in- 
ternetkeskusteluaineistoja, jotka sisältävät yhteensä lähes kolme miljar- 
dia sanetta eli sananmuodon esiintymää. 


ORP R | 29/972 korpusta valittuina — 6,95G / 13,34G sanetta s 


Yksinkertainen | Laaje i v Valitse kaikki 


x Tyhjennä 


1600 1700 1800 1900 2000 


myös alkuosa C loppuosz 


Agricola (9) 
[E-thesis (24) 


virkkeistä —v|jotkasisält 


[FinnTreeBank: suomen puupankki (3) 
O Kansalliskirjaston lehtikokoelman (KLK) suomenkieliset lehdet (179) ana v 
DKirjallisuutta (22) 


[ Juridisia tekstejä (6) 


Konkordanssi:| osumia sivulla: 


4vvvvvtv 


=] Internet-keskusteluaineistoja (30) © Internet-keskusteluaineistoja 
b Suomi24 2001-2017 (17) 


P Suomi24 2016H2 (10) 20 kopan ie 

MSuomi24 2001-2014 (näyte) 6 954 024 578 sanetta 
FA Yiilauta 621 567 531 virkettà 
& HS [ACA] 

> [11990-ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä (369) 

> []Verkkouutisia (16) 

D Suomenkielen tekstikokoelma (SKTP/FTC) (50) 

D []Muitatekstejà (12) 

> [Puhuttua kieltä (tekstiksi litteroituna) (137) 

> [Seikokieli (2) 

> 

> 

> 


A Suomenoppijoiden kieltä (suomi toisena tai vieraana kielenä) (4) 


Vanhan kirjasuomen korpus (12) 


[] Varhaisnykysuomen korpus (93) v 


Kuvio 2. Aineiston valitseminen KORPissa. 


Aineiston valinnan jälkeen siitä voi tehdä hakuja. Jos aineisto on kieli- 
opillisesti koodattu, haun voi myös kohdistaa tiettyyn sanaluokkaan. 
Esimerkkihaussa valituissa internetkeskusteluissa näin on, joten ohjel- 
ma ehdottaa pudotusvalikossa tarkennuksia hakuun. Haettaessa sanaa 
sossupummi tarkennuksena voi valita esimerkiksi sanaluokan tai jonkin 
sanan, jonka osana tämä on. 
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Oz Veronika Laippala - Os 


€ e. OA https//korp.cscfi/ 
Suomi | Ruotsi | Muut kielet | Rinnakkaistekstit 


Mo [ 2 ] 29/972 korpusta valittuina — 6,95G / 13,34G sanetta 


s reduce=word&corpus= 


Yksinkertainen | mec | n eal Vertailu | 
ee) 
Isossupummi Hae v 
sossupummi (substan 15080 ja suuraakkoset 


sossupummiperhe (substantiivi) 


sossupummiloinen (substantiivi) 


K  sossupummius (substantiivi) 


~| Tilastoja: laskentaperuste: sana ~ [DNäytä: 


sossupummiudesta (substantiivi) 
Jussuf (substantiivi) 
sossupummisika (substantiivi) 
sossupummiluuseri (substantiivi) 
sossupummiutta (substantiivi) 
sossupummiäiti (substantiivi) 
sossupummikaveri (substantiivi) 
Jussufin (substantiivi) 
sossupummikunta (substantiivi) 
sossupummijoukko (substantiivi) 


sossupummi (adjektiivi) 


Kuvio 3. Haku KORPissa. 


Haun tulokset KORP palauttaa ns. konkordanssinäkymänä. Siinä jokai- 
nen hakusana esitetään kontekstissaan omalla rivillään. Hakusanat ovat 
sijoitettuina allekkain vertaamisen helpottamiseksi. 


an voi olla yksinkertainen Et Sinä missään töissä ole, vaan juuri mainitsemasi sossupummi, täällä roikut ruikuttaen juttujasi jan 
Ja perhe juhlii kun oppilaasta tulee sossupummi ja rahaa taas tulee. 
suomi24 2001-2017: 2002 
Yksilöitä saa arvostella |" naapurin somali on sossupummi ") mutta jos sanot, että kaikki somalit on sossupummeja se on rasismia. 
et kai halua että sinun uudeksi nimeksi 'e sossupummi tai jotain vastaavaa. 
Jos ei työ, vaikka huonokin kelpaa saat mun puolesta nääntyökin nälkään sossupummi. 
ierrà sossupummi sätkä ja käperry vuokrayksiösi nurkkaan pillittämään. 
He kaikki meuhkaavat siitä, että naapurissa asuu joku sossupummi, joka saa tekemättä mitään ehkä jopa 1000 euroa kuussa! 
SUOMI24 2001-2017: 2003 


imerkit taitaa kaikki olla omiasi Mukavaa väitellä itsensä kanssa,aina oike, 


Wau mitkä tulevaisuudensuunnitelmat: " Musta tulee sossupummi! " 
josta opiskelijan ahdingosta, sossupumi 
pakolaisista, jos on ite yhtä sossupum: 


Olet aivan oikeass 
Turha vinkua mit 
ko oikeaan, jos veikkaan että olet Suomeen muualta tullut ja asumaan jäänyt sossupummi. 
xut vaihtaa koulua ja sitten minusta ehkä olisikin tullut häirikkö yläasteella ja sossupummi myöhemmin. 
san 0€/kk,koska olen alle 20 v ja vanhempien tulot vaikuttaa joten revi siitä sossupummi 
eikkaanpa. että olet perinnöttömäksi jätetty (ilmiselvästi aiheesta ) katkera sossupumi 
Oletko jonkinlainen sossupummi, raha tulee niin kuin itestään? 
sä tiiät että juoksen rahan perässä saattana ku et edes tunne mua mun ex oli sossupummi et sillä ei paljo rahaa ollut 
Älä nyt sossupummi hermostu ...hahahah, ,ci ne aivan hukkaan minun kohdallani ole tuet menneet, pystyn elätään itseni ja vielä sinutkir 
mistä sä yhtäkkiä keksit olla sossupummi somali? vai vihaatko muuten vaan. 
Olen sivari ja sossupummi 
imeiseen väittelyoljenkorteen " joo oot joku sossupum: 
Otahan sossupum, 
Minä ainakin olen rehti vapautuksen saanut sossupummi ja sillä selvä. 
ane itse, käykää töissä ja ommelkaa läpi kiinne ettei joka vuosi pulkahda uusi sossupummi! 
ppinut olemaan vihaamatta oman maan kansalaisia oli kyseessä sitten sivari, sossupummi tai pultsari. 


in laiskottelee, eikä se sinänsä kuulu edes teille mennä vinkumaan että vitun sossupummi. 


Ittamaan kun tuohon porvarin 


ista selvää ennenkuin huudat täällä suu vaahdossa rotusodasta. 


Kuvio 4. KORPin konkordanssinäkymä. 
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Korpus 
Suomi24 (1/10) 


Kuvailutiedot 

Lisenssi: CC BY-NC (CLARIN PUB) 
Viittaa korpukseen 

Linkki korpukseen Korpissa: urn:nbn:fi:lb- 
2015120401 


Tekstin piirteet 


otsikko: Maidon hinnasta 6 senttiä 
tuottajalle ! 

otsikon sanojen perusmuodot: maito hinta 
6 sentti tuottaja! 

päiväys: 09.06.2015 

kellonaika: 22:24 

keskusteluketjun tunniste: 13638742 

viestin tunniste: 79488733 

pääaihealue: Yhteiskunta 

aihealueen tarkennus: Politiikka > 
Puolueet > Suomen Keskusta 

nimimerkki: kjcfgjj 

nimimerkin sanojen perusmuodot: kjcfgij 


Sanan piirteet 


perusmuoto: sossupummi 

perusmuoto (yhdyssanarajat): 
sossu|pummi 

sanaluokka: substantiivi 

morfologinen analyysi: NUM Sgl 
CASE Nom 

dependenssisuhde: suora objekti 

sanan sijainti nimessä: ulkopuolella (O) 


alkuperäinen keskustelu 
alkuperäinen viesti 


Näytä dependenssipuu 


Kuvio 5. Tekstin ja haetun sanan kuvailutiedot korpuksessa. 


Konkordanssinäkymässä jokaisesta rivistä on myös mahdollista näh- 


dä hakusanan alkuperä. Kuvion 4 esimerkin ensimmäisen rivin tiedot 
kuvataan kuviossa 5. Siitä käy ilmi, että teksti on peräisin Suomi24- 


aineistosta (Aller Media Oy 2014). Lisäksi kuvataan tarkemmin tekstin 
piirteitä ja sanan piirteitä. Näiden avulla hakusanasta saa enemmän ja 


tarkempaa tietoa. 
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6. Kayta valmiita korpuksia! 


Moniin tarkoituksiin sopivia valmiita korpuksia on avoimesti saatavilla, 
ja erityisesti gradutöitään miettivien opiskelijoiden kannattaa tutustua 
niihin. Valmis aineisto säästää paljon tutkijan aikaa. Korpuksen meta- 
tiedoista voi lukea, millä periaatteilla korpus on koostettu. Aineistona 
sen pitäisi olla luotettava ja edustava. Sanalla sanoen sen kokoaja on 
jo ratkaissut monta ongelmaa tutkijan puolesta, ja tutkija voi keskittyä 
ratkomaan valitsemaansa tutkimuskysymystä. Avoimesti saatavilla ole- 
va aineisto on sikälikin parempi kuin yksittäisen tutkijan tai opiskeli- 
jan omaan käyttöön kokoama (pieni) aineisto, että se on myös muiden 
tutkijoiden käytettävissä, tutkimus on periaatteessa toistettavissa ja sen 
aukot voidaan osoittaa ja tulosten pohjalta on helpompi suunnitella 
jatkotutkimuksia. 

Vaikka erityisesti jo valmiiksi sähköisessä muodossa olevia tekstejä 
saattaa olla kohtuullisen helppo koota opinnäytetyön korpukseksi, on 
kuitenkin korostettava, että huolellisesti kootut laajat korpukset ovat lä- 
hes aina ryhmätyön tulosta. Niiden saattaminen valmiiksi ja muiden 
tutkijoiden saataville kestää vuosia ja vaatii monenlaisia resursseja ja 
verkostoja, joita yksittäisellä tutkijalla tai opiskelijalla harvemmin on. 

Fri kielten tai genrejen osalta valmiiden korpusten saatavuudessa on 
toki eroja. Englanti on luultavasti maailman tutkituin kieli, joten eng- 
lannin korpuksia on jo ehditty kokoamaan moneen lähtöön, mikä nä- 
kyy tämänkin luvun korpusesimerkeissä, ja lisää esimerkkejä voi hakea 
Corpus Resource Database (CoRD) -tietokannasta?. Kielipankin tarjonta 
laajentuu jatkuvasti tutkijoiden tallentaessa sinne aineistojaan ja kat- 
taa tällä hetkellä monien suomen kielen korpusten lisäksi useita muita 
kieliä ja tekstilajeja, kuten Pohjoissaamen korpus, Lettere amorose ja 
Lyydin korpus.?* Joistain kielistä valmiita korpuksia ei juurikaan ole, ja 
olisikin syytä miettiä, voitaisiinko tällaisten kielten tutkimusta edistää 
kokoamalla avoimesti saatavilla olevia korpuksia. 

Valmistakaan aineistoa ei voi käyttää sokkona, vaan sen kokoamis- 
periaatteisiin on tutustuttava huolella. Ensin kannattaa kaivaa esiin 
valitun korpuksen kokoamisperiaatteita ja sisältöä selostava käsikirja 
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eli korpusmanuaali, jos korpuksen kokoajat ovat sellaisen laatineet. 
Korpusmanuaali on tutkijan keskeinen tietopaketti aineistosta, ja myös 
oman korpuksen kokoajan on syytä dokumentoida aineistonsa luonne 
paitsi omaan käyttöön myös mahdollisia muita käyttäjiä varten. ICAME 
Corpus Manuals -sivustolla” voi tutustua erilaisiin korpusmanuaalei- 
hin ja niiden sisältämään tietoon. Lisäksi kannattaa tutustua aiempaan 
kyseisestä korpuksesta tehtyyn tutkimukseen, jota voi aluksi hakea vaik- 
kapa Google Scholarin avulla, ellei sitä ole koottu yhteen esimerkiksi 
korpuksen verkkosivulle. 

Kävimme edellä läpi joitakin korpuksen kokoamiseen liittyviä yleisiä 
periaatteita, jotka on hyvä huomioida paitsi oman korpuksen kokoami- 
sessa myös valmiin korpuksen käytössä. Hyvä korpusmanuaali ottaa 
kantaa juuri edellä kuvattuihin seikkoihin ja esittää kokoamisperiaatteet 
läpinäkyvästi. 


7. Korpustutkimuksen rajoitteet ja ongelmat 


Ehkä aivan ensimmäinen harha, jonka valtaan korpustutkija saattaa 
huomaamattaankin joutua, on kuvitella, että korpuksessa on kielen koko 
kirjo ja ”lopullinen totuus” kielestä. Suomalaisen korpustutkimuksen 
uranuurtajiin lukeutuva Matti Rissanen (1989) viittaa tähän tutkijan 
harhaan käsitteellä God's Truth Fallacy. Korpus ei ole koko totuus kie- 
lestä, vaan laajoihinkin korpuksiin voi liittyä monenlaisia edustavuu- 
den rajoitteita. Korpukset ovat esimerkiksi paljolti olleet kirjoitetun kie- 
len aineistoja, koska puhetta on paljon vaikeampi kerätä ja muuntaa 
tekstimuotoon, ja puhekin on saattanut olla tietyntyyppistä suunnitel- 
tua tai harkittua puhetta pikemminkin kuin arkipuhetta. Aineisto on 
usein sitä, mitä saa kohtuullisella vaivalla. On siis täysin mahdollista, 
että kielellinen ilmiö on olemassa, vaikka sen esiintymiä ei korpuksesta 
löytyisikään. 

Korpuksista ei voi myöskään hakea kaikkea mahdollista automaatti- 
sesti, ja haettavuus vaikuttaa siihen, mitä ja miten voidaan tutkia. Sanoja 
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ja sanan osia voi hakea, ja jos kyseessä on syntaksiannotoitu korpus, 
kenties sanaluokat tai lauseenjäsenet ovat helposti tutkijan ulottuvilla. 
Myös semanttisia luokitteluja saattaa sisältyä korpukseen, tai tutkijan on 
mahdollista luoda niitä itse semanttisten taggereiden eli semanttisia roo- 
leja tunnistavien ohjelmien avulla. Vaikka tällaiset merkinnät helpottavat 
monella tapaa tutkijan työtä, on kuitenkin tiedostettava, että mitä enem- 
män hyödyntää valmiita luokitteluja, sitä sidotumpi on tiettyyn kielioppi- 
malliin ja sen rajoitteisiin (ks. Kieliopin tutkimus ja kielioppiteoriat tk.). 

Jotkin kielen ilmiöt ovat kerta kaikkiaan vaikeammin haettavia kuin 


toiset. Niin kauan kuin ilmiön voi sitoa tiettyihin sanoihin tai fraaseihin, 
hakeminen on helppoa. Pragmaattisia ja vuorovaikutteisia ilmiöitä voi kui- 
tenkin olla vaikea tutkia korpusmenetelmin, jollei niitä pysty operationaa- 
listamaan haettavalla tavalla eli yhdistämällä niitä sanoihin tai fraaseihin. 

Korpustutkijat kuvaavat mielellään omaa tutkimustaan sloganilla ”tut- 
kimus alkaa siitä, mihin laskeminen loppuu" (engl. research begins where 
counting ends). Tämä lentävä lause kuvaa hyvin sitä, että laskeminen ei 
ole korpustutkimuksen itsetarkoitus vaan laskemalla pystytään vastaa- 
maan tutkimuskysymyksiin. Korpustutkimuksen laskennallisuuteen 
saattaa kuitenkin liittyä myös ongelmia, joista on hyvä olla tietoinen. 
Kun lingvistiseen koulutukseen ei läheskään aina sisälly edes alkeellista 
tilastotieteellistä elementtiä, korpustutkijan on erikseen perehdyttävä 
alansa laskennalliseen puoleen ja kenties värvättävä projekteihinsa alan 
osaajia. Jotkin korpusohjelmat, kuten WordSmith?* ja AntConc”, tarjoa- 
vat tilastollisiin menetelmiin perustuvia työkaluja, jolloin tutkijan ei vält- 
tämättä tarvitse itse laskea, mutta hänen on kuitenkin pääpiirteissään 
ymmärrettävä, mitä työkalut hänen puolestaan tekevät. 

Korpusten käyttö mahdollistaa kielen tarkastelun erillään kielenkäy- 
tön tilanteesta, mutta tutkijan on aina tunnettava korpuksen tekstit ja 
niiden kielellinen ja kulttuurinen konteksti. Esimerkiksi koneellisesti in- 
ternetistä koostettuihin aineistoihin voi olla päätynyt osia, jotka vääristä- 
vät analyysia, jos kontekstiin ei kiinnitä huomiota: esimerkiksi virke Lue 
lisää esiintyy hyvin usein internetsivuilla muttei silti kerro juuri mitään 
siellä käytettävästä kielestä. Kielenkäytön kontekstiin tutustuminen voi 
aineistosta ja tutkimuskysymyksistä riippuen tarkoittaa esimerkiksi kor- 
puksen sisältämien genrejen ominaispiirteisiin ja tuotantoprosesseihin 
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perehtymistä tai tekstien kirjoittajien henkilöhistorioiden ja keskinäis- 
ten verkostojen kartoittamista ja sijoittamista tutkittavan ajan yhteiskun- 
nalliseen kontekstiin. Tässä kontekstualisointityössä tarvitaan yleensä 
apuna muiden (alojen) tutkijoiden tuottamaa tietoa, joka voi olla luon- 
teeltaan esimerkiksi historiallista tai yhteiskuntatieteellistä. 


8. Yhteenveto 


Tässä artikkelissa olemme käsitelleet korpusten käyttöä ja niiden kokoa- 
mista kielentutkimuksessa. Olemme myös esitelleet erilaisia korpuksia ja 
pohtineet korpustutkimuksen hyötyjä ja mahdollisia sudenkuoppia. Ku- 
ten mainitsimme johdannossa, korpusten kokoaminen ja käyttö liittyvät 
läheisesti yhteen tietotekniikan kehityksen kanssa. Jo nyt kielentutkijoilla 
on tietokoneiden avulla mahdollisuus päästä käsiksi valtaviin aineistoi- 
hin, ja automaattiset ohjelmat helpottavat tutkijan tekemää analyysia 
esimerkiksi syntaksijäsennyksen avulla. Parhaimmillaan menetelmien 
kehittyminen synnyttää uudenlaisia tutkimuskysymyksiä ja avaa kieleen 
sellaisia näkökulmia, joita emme vielä osaa edes ennustaa. Tulevaisuu- 
dessa onkin mielenkiintoista päästä seuraamaan, miten ala kehittyy. 
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* Preseea: http://preseea.linguas.net/Corpus.aspx 
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Keskeisia italiankielisià korpuksia: 
* Biblioteca della letteratura italiana: http://www.letteraturaitaliana.net/ 


* Corpus PAISA: http://www.corpusitaliano.it/en/ 
* Corpus di italiano scritto, CORIS/CODIS: 
http://corpora.dslo.unibo.it/coris ita.html 
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Listaus italiankielisiin korpuksiin: http: //www.accademiadellacrusca. 


it/it/link-utili/banche-dati-dellitaliano-scritto-parlato 


Keskeisiä ranskankielisiä korpuksia: 


Corpus Frantext: https://www.frantext.fr 


Corpora of Computer-Mediated Communication CoMeRe: 
https: //repository.ortolang.fr/api/content/comere/v3.3/comere.html 


Korpuskokoelma Ortolang: http://www.cnrtl.fr/ 


Keskeisiä ruotsinkielisiä korpuksia: 


Oslon yliopiston pohjoismaalainen murreaineisto: http://www. 
hf.uio.no/iln/tjenester/kunnskap/sprak/korpus/talesprakskorpus/ 
nordisk-dialekt/index.html 

Suomenruotsalainen murrekorpus TALKO: http://www.sls.fi/talko 


Spräkbanken: https://spraakbanken.gu.se/ 


Keskeisiä saksankielisiä korpuksia: 
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Clarin-D-keskusten korpusesittely: 
https://www.clarin-d.net/en/corpora 


Itävallan Akatemian korpus: http://www.aac.ac.at/ 


Katsaus saksankielisiin korpuksiin: Teubert, Wolfgang. 2012. 
Corpora: German language. Julkaisussa: The Encyclopedia of Applied 
Linguistics. Wiley Online Library, 1-10. 

Puhutun saksan arkisto "Archiv für gesprochenes Deutsch”: 
http://agd.ids-mannheim.de/index.shtml 


Saksan kielen referenssikorpus "Deutsches Referenzkorpus" 
(DeReKo): http://www1.ids-mannheim.de/kl/projekte/korpora.html 
Saksan kielen digitaalisen sanakirjan (DWDS) korpukset: 
https://www.dwds.de/ 

Sveitsinsaksan korpus "Schweizer Textkorpus": 
https://www.chtk.ch/index.php/de/ 
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* Virheannotoitu oppijansaksan korpus — ”Falko, fehlerannotiertes 
Lernerkorpus des Deutschen als Fremdsprache”: 
https://www.linguistik.hu-berlin.de/de/institut/professuren/ 


korpuslinguistik/forschung/falko 


Keskeisiä vironkielisiä korpuksia: 
* Eesti Keeleressursside Keskus: 
https://keeleressursid.ee/et/keeleressursid/tekstikorpused. 


* Eesti Kirjakeele Korpus 1890—1990: 
http://www.cl.ut.ee/korpused/baaskorpus 


e Eesti keele koondkorpus: 
https://www.keeletehnoloogia.ee/et/ekktt/ekktt-projektid/eesti- 


keele-koondkorpus/koondkorpus 
* Eesti vahekeele korpus (oppijankielen korpus): http://evkk.tlu.ee 
* Tasakaalus korpus: http://www.cl.ut.ee/korpused/grammatikakorpus 


Esimerkkejä muunkielisistä korpuksista ja kokoelmista: 

e Komi: http://wiki.fu-lab.ru/index. 
php/%D0%92%D0%B8%D0%BA%D0%B8 FU-Lab 

e Portugali: Davies & Ferreira (2006), historiallisen portugalin korpus: 


https://www.corpusdoportugues.org 


* Saame: Tromssan yliopiston saamen kieliteknologia: 
http://giellatekno.uit.no/index.fin.html 

e Tataari: Corpus of Written Tatar: http://www.corpus.tatar/en 
Tatar National Corpus ”Tugan tel”: http://web-corpora.net/ 


TatarCorpus/search/?interface language=en 


e Turkki: Turkish National Corpus: https://www.tnc.org.tr/ 


* Udmurtti: http://web-corpora.net/UdmurtCorpus/search/index. 


php?interface language=en 


* Unkari: Unkarin kielen kansalliskorpus: 
http://corpus.nytud.hu/mnsz/index eng.html 


e Venäjä: Venäjän kansalliskorpus 
https://ruscorpora.ru/ 
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Esimerkkejä käännöstieteellisen korpustutkimuksen keskeisistä 

korpuksista: 

* Community Interpreting Database (ComlnDat): 
http://www.yorku.ca/comindat/comindat.htm 


e The English Norwegian Parallel Corpus (ENPC): 
http://www.hf.uio.no/ilos/english/services/omc/enpc/ 


* The European Parliament Interpreting Corpus (EPIC): 
http://metashare.elda.org/repository/browse/european-par- 


liament-interpretation-corpus-epic/fde33884de7611e2b1e- 


400259011f6ea48ac8ceob41f48e6be224bbeeodsocbo/ 


e Käännössuomen korpus. Ks. esim. Mauranen, Anna. 2000. Strange 
strings in translated language. A study on corpora. Julkaisussa: 
Olohan, Maeve (toim.) Intercultural faultlines. Research models in 
translation studies |. Textual and cognitive aspects. Manchester: St. 
Jerome, 119—141. 


* The Open Parallel Corpus Opus: http://opus.lingfil.uu.se/ 
e Translational English Corpus: https://www.alc.manchester. 


ac.uk/translation-and-intercultural-studies/research/projects/ 


translational-english-corpus-tec/ 
e YLE-korpus: https://wiivi.uef.fi/crisyp/disp/ /fi/cr redir all/fet/fet/ 
sea?direction=1&id=-29931 


Esimerkkejä kielitypologian keskeisistä aineistoista: 
e AUTOTYP-tietokanta: https://github.com/autotyp/autotyp-data 
+ The Ethnologue: https://www.ethnologue.com/ 


e Glottolog: https://glottolog.org 
* Typological Database System: 


https://languagelink.let.uu.nl/tds/index.html 
e The World Atlas of Language Structures Online: https://wals.info/ 
e Cross-Linguistic Linked Data: https://clld.org/ 
* Database of Places, Language, Culture and Environment: 


https://d-place.org/ 
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Luku 10 Määrällinen korpuslingvistiikka 


Aki-Juhani Kyröläinen 


Veronika Laippala 
O https://orcid.org/0000-0002-7635-429X 


Mikä? 


Määrällinen korpuslingvistiikka on kielenkäytön, sen vaihtelun ja kielen 
rakenteen tutkimusta laajojen aineistojen pohjalta. Analyysi on empiiris- 
tä, ja se perustuu laskennallisiin, tietokoneella toteutettuihin menetel- 
miin. Aineistot ovat tyypillisesti konelukuisia, ja ne on koottu tiettyjen 
kriteerien mukaan (ks. Korpusaineistot tässä kirjassa). 


Katso myös: 
Luku 7 Laadullinen aineistopohjainen kielentutkimus 
Luku 9 Korpusaineistot 


Luku 11 Historiallinen korpuslingvistiikka 
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1. Johdanto 


Määrällisessä korpustutkimuksessa kieltä tutkitaan laajan, konelukui- 
sen aineiston pohjalta. Määrällisen korpustutkimuksen tavoitteena on, 
että tutkimusaineiston tulokset eivät kata vain tutkimusaineiston ta- 
pauksia vaan ovat yleistettävissä (ks. Korpusaineistot tk.). Esimerkiksi 


ns. yleiskorpuksiin (engl. general corpus) lukeutuvaan British National 
Corpukseen perustuvien tutkimusten voidaan ajatella kertovan jotakin 
brittienglannista yleensä, vaikka korpus ei tietenkään sisällä kaikkea 
brittienglanniksi kirjoitettua tekstiä tai edes kaikkia sen varieteette- 
ja. Tässä artikkelissa lähestymme määrällistä korpustutkimusta juuri 
tekstiaineistojen näkökulmasta. Havainnollistamme aihetta esimerkki- 
tutkimuksella (Lehti, Luodonpaa-Manni, Jantunen, Kyrölainen, Vesanto 
& Laippala, tulossa 2020), jossa käytämme aineistona Suomi24- 
keskustelufoorumin keskusteluja (Aller Media Oy 2014). Keskustelujen 
voidaan ajatella edustavan laajassa mielessä nykysuomea ja suppeas- 
sa mielessä verkkokeskustelupalstoilla käytettävää kieltä (ks. Lagus, 
Pantzar, Ruckenstein & Ylisiurua 2016). 

Määrällisessä korpustutkimuksessa analyysi on empiiristä. Se tarkoit- 
taa, että analyysi ja tutkimuksen tulokset pohjautuvat aineistosta tehtyi- 
hin havaintoihin. Tavallisesti määrälliset korpustutkimukset hyödyntävät 
suuria tekstiaineistoja, joiden katsotaan edustavan tutkimusaihetta. Käy- 
tännössä tekstiaineistot perustuvat laajaan otokseen kielestä tai tietyistä 
kielen ilmiön esiintymistä. Siksi määrällisessä korpustutkimuksessa 
hyödynnetään laskennallisia menetelmiä, valmiiksi tehtyjä tekstiaineis- 
toja ja tietokoneavusteisia menetelmiä, kuten morfosyntaktisia jäsen- 
timiä. Nämä menetelmät eivät kuitenkaan ole itse tutkimuskohteena, 
vaan niiden avulla on tarkoitus jäsentää tekstiaineisto analyysia varten. 

Usein empiirisiksi kutsutut, määrälliseen aineiston havainnointiin 
pohjautuvat menetelmät nähdään vastakkaisina intuitioon perustuville 
menetelmille. Jyrkän vastakkainasettelun sijaan olisi parempi ajatel- 
la näitä lähestymistapoja toisiaan täydentävinä näkökulmina kieleen. 
Lisäksi on syytä muistaa, että vaikka määrälliset, numeerisessa muo- 
dossa olevat tulokset antavat pohjan määrälliselle korpustutkimukselle, 
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laadullinen analyysi on myös olennainen osa sitä. Jotta tutkimustulok- 
set todella merkitsevät jotain, numeeriset tulokset pitää tulkita. Mitä ne 
tarkoittavat, miten ne vastaavat tutkimuskysymyksiin tai mitä ne kerto- 
vat kielestä yleensä? Tämän vuoksi laadullista analyysia ei voi unohtaa 
myöskään määrällisessä tutkimuksessa. 

Määrällinen korpuslingvistiikka voidaan nähdä joko menetelmänä eli 
lähestymistapana aineistoon tai omana tutkimusparadigmanaan. Tämä 
jako juontaa juurensa Tognini-Bonellin (2001) esittämään luokitteluun 
korpuspohjaiseen (engl. corpus-based) ja korpuslähtöiseen (engl. corpus- 
driven) tutkimukseen (ks. Korpusaineistot tk.). Näistä ensimmäinen 
käyttää aineistoa testaamaan ennalta muodostetun, teoriaan perustuvan 


hypoteesin, ja tässä korpuslingvistiikka nähdään nimenomaan menetel- 
mänä. Toisessa taas ajatellaan hypoteesien ja tutkimuskohteiden nou- 
sevan itse korpuksesta. Tässä korpuslingvistiikka nähdään siis pelkkää 
menetelmää kokonaisvaltaisempana suuntauksena tai tutkimuspara- 
digmana. Kognitiivisessa kielentutkimuksessa taas todelliseen kielen- 
käyttöön ja aineistoihin nojautuvaan tutkimukseen viitataan käyttö- 
pohjaisena tutkimuksena. 

Koska määrällinen korpustutkimus perustuu suuriin aineistoihin ja 
niistä laskennallisesti saatuihin tuloksiin, sen etuna on, että tulokset 
ovat yleistettävissä ja kielestä tai tutkitusta yksittäisestä ilmiöstä saa laa- 
jemman kuvan. Toisaalta haasteena on, että aineiston kokoaminen on 
itsessään aikaa vievä tehtävä. Korpuslingvistiikan keinoin on tarkasteltu 
eniten sellaisia kieliä, joista on olemassa valmiita aineistoja. Erityisesti 
englanninkielisellä korpuslingvistiikalla on pitkät perinteet, ja englan- 
nin kielestä onkin jo olemassa sekä kattavia aineistoja että kehittyneitä 
tietokoneavusteisia menetelmiä tekstiaineistojen automaattiseen käsit- 
telyyn. Suurten tekstiaineistojen ansiosta yhtäältä tietokoneavusteiset 
menetelmät ja toisaalta digitaalisten aineistojen kokoaminen ovat kehit- 
tyneet ja helpottuneet viime vuosina. Näiden ansiosta tulevaisuudessa 
voi odottaa, että kielten eriarvoisuus vähenee ja myös vähemmän tutki- 
tuille kielille kootaan monipuolisia ja valmiita aineistoja sekä tehokkaita 
analyysityökaluja. 

Useimmiten määrällisessä korpustutkimuksessa tarkastelu kohdis- 
tuu sellaiseen kielen ainekseen, jota aineistosta pystytään koneellisesti 
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laskemaan. Tästä syystä määrällinen korpustutkimus tyypillisesti lä- 
hestyy kieltä joko tarkastelemalla kielellisten ilmausten muotojen vä- 
listä vaihtelua tai keskittymällä tiettyyn muotoon, esimerkiksi sanaan 
tai sijamuotoon. Näissä lähtökohtana on muodon suhde merkitykseen 
eli siihen, mitä merkityksiä se saa ja millaisissa käyttöyhteyksissä sitä 
käytetään. Toinen vaihtoehto on lähestyä kieltä merkityksestä muotoon 
-näkökulmasta. Tässä tapauksessa tutkimusaiheena voisi esimerkiksi 
olla, miten sijaintia ilmaistaan suomen kielessä, ja tutkimus alkaisi si- 
jainnin ilmausten tunnistamisella aineistosta. Tämä on kuitenkin har- 
vinaisempaa, vaikka tietyt merkityslähtöiset tutkimusaiheet voivat näin 
tehdä. Esimerkiksi juuri nyt pinnalla olevan sentimenttianalyysin eli 
mielipiteiden automaattisen tunnistamisen tavoitteena on tunnistaa ai- 
neistosta kaikki mielipidettä ilmaisevat kielen muodot. 
Suomi24-keskustelufoorumin avulla voidaan havainnollistaa kahta 
edellä mainittua lähestymistapaa. Esimerkkitutkimuksemme tavoitteena 
on tutkia, miten näissä verkkokeskusteluissa keskustellaan köyhyydestä. 
Tätä varten olemme eristäneet aineistosta otoksen kommentteja, joissa 
käytetään sanaa köyhä tai sen lähisynonyymisia sanoja, kuten varaton. 
Näiden ilmausten voidaan siis ajatella olevan muotoja, joiden kautta 
lähestymme yhtäältä köyhyyden käsitettä ja toisaalta sen ilmaisemista 
kielessä. Toisin sanoen tutkimusaihe, köyhyys, on muutettu mitattavaan 
muotoon lähisynonyymien avulla. Tutkimusaihetta olisi voinut tietysti 
lähestyä myös merkityksestä muotoon -näkökulmasta. Tämä kuitenkin 
edellyttäisi, että tutkittava aineisto olisi jo jäsennetty merkityksen ja tut- 
kimuskohteen kannalta tarkoituksenmukaisella informaatiolla. Käytän- 
nössä kaikki köyhyyttä käsittelevät kommentit, myös ne, joissa sanaa 
tai sen lähisynonyymia ei mainita, olisi pitänyt jollain tavalla tunnistaa. 
Tämä olisi tietysti varsin työlästä. Tämän vuoksi määrällinen korpus- 
tutkimus lähestyy kieltä pääsääntöisesti muodosta merkitykseen. 
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2. Historiaa ja tutkimuksen lähtökohdat 


Vaikka nykyaikainen määrällinen korpustutkimus perustuu konelukui- 
siin, digitaalisessa muodossa oleviin aineistoihin ja tietokoneavustei- 
seen laskentaan, kielenkäyttöä on kuvattu aineistopohjaisesti jo kauan 
ennen tietokoneita. Jo 1700-luvulla Samuel Johnsonin Dictionary of 
English Language pohjautui kielenkäyttäjien tuottamiin virkkeisiin ja 
vuonna 1928 julkaistu Oxford English Dictionary yli viiteen miljoonaan 
kielenkäyttäjän sitaattiin, jotka vapaaehtoiset olivat keränneet. Vuonna 
1940 julkaistiin Charles Friesin American English Grammar, jonka poh- 
jana oli Yhdysvaltojen hallitukselle lähetettyjä kirjeitä. 

1960- ja 1970-luvuilla määrällistä korpustutkimusta tehtiin varsin vä- 
hän. Silloin vallalla oli generatiiviseen kielitieteeseen perustuva kielikäsi- 
tys, jonka mukaan kieli on ennen kaikkea ihmismielen ilmiö ja kielellisen 
tuotoksen eli aineistojen tutkimuksen ei katsottu olevan tarkoituksen- 
mukaista. Määrällisen korpusanalyysin voidaan kuitenkin katsoa alka- 
neen 1960-luvun lopulla, jolloin julkaistiin Brown-korpus, yli miljoona 
sanaa käsittävä elektroninen kieliaineisto (ks. Korpusaineistot tk.). Sa- 


mankaltaisia aineistoja syntyi tästä lähtien yhä enemmän, ja näitä aineis- 
toja hyödyntäviä, korpuspohjaisia tutkimuksia alettiin julkaista. Suomessa 
varhaisimpiin korpuksiin lukeutuu Oulun yliopistossa 1960-luvulla koos- 
tettu suomen kielen yleiskorpus Oulun korpus", jonka perusteella on teh- 
ty esimerkiksi suomen kielen sanojen yleisyystilasto (Saukkonen 1977). 
Tyypillisesti määrällisen korpuslingvistisen analyysin peruslähtökoh- 
tana on laskea tarkasteltavan kielellisen elementin frekvenssi aineistossa, 
esimerkiksi kuinka usein tiettyjä sanoja tai syntaktisia rakenteita siinä 
on käytetty. Koska frekvenssillä on keskeinen asema määrällisessä tut- 
kimuksessa, frekvenssiä on tutkittu myös itse ilmiönä (ks. Zipf 1932; 
Yule 1944). Esimerkiksi korkean frekvenssin sanoilla on tunnettuja 
ominaisuuksia verrattuna matalan frekvenssin sanoihin. Ensinnäkin ne 
tyypillisesti muuttuvat hitaammin ajan kuluessa. Tästä ovat esimerkkinä 
germaanisten kielten epäsäännölliset verbit (Bybee 1995; 2010; Cuskley, 
Pugliese, Castellano, Colaiori, Loreto & Tria 2014). Toiseksi ne toden- 
näköisemmin vastustavat leksikaalista korvautumista. Esimerkiksi Pagel, 


LUKU 10 MÄÄRÄLLINEN KORPUSLINGVISTIIKKA 49] 


Atkinson ja Meade (2007) arvioivat, että englanin sanan dirty 'likainen' 
leksikaalinen muoto on muuttunut ajan kuluessa yhdeksän kertaa, kun 
taas sellaiset frekventit sanat kuin two 'kaksi' ja die 'kuolla' ovat pysyneet 
samoina. Kolmanneksi frekventit sanat esiintyvät todennäköisemmin 
yhdessä kulttuurisesti merkittävien tapahtumien kanssa. Esimerkiksi sa- 
nan influenza ’influenssa’ historiallinen frekvenssi osoittaa epidemioiden 
ajankohdat, kun taas äkillinen muutos sanan frekvenssissä voi heijastaa 
sensuuria (Michel ja muut 2011). Siten teoreettinen lähtöoletus frekvens- 
siin perustuvan tutkimuksen taustalla on, että kielen rakenteellisten ele- 
menttien, kuten sanojen, vaihtelu heijastaa eroa kielen toiminnassa, ku- 
ten sanan merkityksessä tai siinä, millaisissa tilanteissa sanaa käytetään. 

Sanan frekvenssi itsessään ei vielä paljasta paljoakaan sanan mer- 
kityksestä tai sen mahdollisista käyttöympäristöistä. Siten määrällisen 
korpustutkimuksen peruslähtökohtana on tarkastella yhteisesiintymiä. 
Esimerkiksi sanojen koira ja musti välistä merkityseroa voi lähestyä tar- 
kastelemalla mahdollisia eroja niiden yhteisesiintymissä eli siinä, mil- 
laisten sanojen kanssa ne esiintyvät yhdessä. Sana koira jakaa kielellistä 
ympäristöä sellaisten sanojen kanssa kuin pentu, kissa ja koiras, kun taas 
musti esiintyy samankaltaisissa ympäristöissä kuin rekku, mirri ja hau- 
va. Näitä yhteisesiintymiä voidaan kutsua myös sanojen jakaumiksi. Jo 
amerikkalainen kielentutkija Harris (1970, 786) totesi, että merkitysero 
heijastuu erona sanojen jakaumissa. 

Sanojen välisillä yhteisesiintymillä on keskeinen asema määrällisessä 
korpuslingvistiikassa. Esimerkiksi Divjakin ja Griesin (2006) kehittämä 
käyttäytymisprofiili-menetelmä (engl. Behavioral profile) arvioi, millais- 
ten kielellisten aineisten kanssa tietty sana tai rakenne esiintyy yhdessä. 
Tätä menetelmää on käytetty esimerkiksi venäjänkielisten yrittämistä 
tarkoittavien verbien (Divjak & Gries 2006) ja englannin get-verbin mer- 
kitysten tarkasteluun (Berez & Gries 2009). Vastaavaa menetelmää on 
käyttänyt myös Arppe (2008) tutkiessaan suomen kielen ajattelua mer- 
kitseviä verbejä. 

Yksittäisten sanojen tai rakenteiden lisäksi voidaan vertailla myös 
kokonaisia tekstejä. Esimerkiksi Biber (1988) tutki rekistereiden eli 
tilanteeseen ja päämäärään sidottujen kielen varianttien tyypillisiä 
piirteitä vertailemalla eri rekistereitä edustavien tekstien sanastoa ja 
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rakenteellisia ominaisuuksia toisiinsa. Tällöin yhteisesiintymä on yk- 
sittäisen tekstin ominaisuuksien (sanasto + rakenne) välillä. Samoin 
kokonaisten tekstien kohdalla esimerkiksi Biber ja Conrad (2009) to- 
teavat, että rekistereillä on omat frekventit kielelliset piirteensä, koska 
näitä piirteitä käytetään tekstissä tiettyä tarkoitusta varten; esimerkiksi 
diskurssipartikkeleita, kuten hei ja joo, käytetään ilmaisemaan vuoro- 
vaikutusta kirjoittajan ja lukijan tai eri kirjoittajien välillä. Vuorovaikutus 
taas on merkittävä osa esimerkiksi verkkokeskusteluja, minkä vuoksi 
partikkelit ovat niissä yleisiä. 

Yhteisesiintymiä varten on tavallista lisätä aineistoon analyysia sy- 
ventävää metatietoa. Vaikka esimerkiksi rekistereitä voitaisiin tarkastella 
sen pohjalta, millainen sanasto on niille tyypillistä, tarkastelun laajen- 
taminen morfologiaan ja syntaksiin tuo rekistereistä enemmän tietoa. 
Metatietoja voidaan lisätä sekä automaattisesti että käsin. Biberin (esim. 
1988) tunnetut tutkimukset rekistereiden ominaispiirteistä hyödyntävät 
taggerin koneellisesti tuottamaa tietoa sanojen merkityksestä ja morfo- 
logiasta (ks. taulukko 1). Käyttäytysmisprofiili-menetelmässä sanojen 
merkitystä tutkitaan aineistoon käsin tehtyjen metatietomerkintöjen 
perusteella. Merkinnät koskevat esimerkiksi tutkittujen sanojen kans- 
sa yhdessä esiintyvien sanojen morfologisia, syntaktisia ja semanttisia 
ominaisuuksia. Tässä artikkelissa käyttämämme Suomi24-aineisto taas 
sisältää keskustelupalstalta automaattisesti tullutta metatietoa muun 
muassa kommenttien julkaisuajasta ja aihepiiristä. 


Sana Taggerin analyysi 


| ppia pp1 : first person subject pronoun + first person pronoun 


just rb emph : adverbial emphatic 

opened vbd xvbn : past tense verb + past participle form 

my pp$ pp1 : possessive determiner + first person pronoun 
secret jj atrb : adjective + attributive function 

bag nn : singular common noun 


Taulukko 1. Taggerin tuottamaa metatietoa (Biber 1988). 


LUKU 10 MÄÄRÄLLINEN KORPUSLINGVISTIIKKA 493 


Tulevaisuudessa, kun kieliteknologian menetelmät kehittyvät, voi- 
daan koneellisesti tunnistaa ja merkitä yhä monipuolisempia kielen 
ominaisuuksia. Tällöin käsin tehtävän esikäsittelyn määrä vähenee 
merkittävästi ja vastaavasti korpuslingvistiikan mahdollisuudet kasva- 
vat entisestään. 


3. Menetelmiä 


Tässä luvussa esittelemme määrällisen korpuslingvistiikan menetelmiä. 
On tärkeä tuoda esille, että tässä artikkelissa käytetyt ohjelmistot ovat 
vapaasti saatavilla. Luvuissa 3.1 ja 3.2 käsittelemme perinteisiä ja laajasti 
käytettyjä menetelmiä, jotka ovat saatavilla erityisesti korpusaineistojen 
käsittelyyn tarkoitetuissa ohjelmistoissa, kuten AntConcissa ja Word- 
Smithissä. Luvussa 3.3. puolestaan käsittelemme koneoppimista ja sen 
mahdollisuuksia korpuslingvistiikassa. 

Koneoppiminen käsittää luonnollisesti laajan joukon erilaisia mene- 
telmiä. Menetelmät myös kehittyvät koko ajan, eikä niiden käyttö ole vie- 
lä vakiintunut korpuslingvistiikassa samalla tavoin kuin luvuissa 3.1. ja 
3.2. esiteltyjen menetelmien. Koska koneoppimisella on kuitenkin pal- 
jon annettavaa kielentutkimukselle, haluamme tässä artikkelissa valot- 
taa sen toimintaa. Hyödynnämme kahta ohjelmointikieltä, Pythonia ja 
R:ää. Molemmat ovat laajasti käytössä sekä akateemisessa ympäristössä 
että yritysmaailmassa. Ne ovat vapaan lähdekoodin ohjelmia ja vapaasti 
saatavilla. Perinteisesti Python on painottunut enemmän tietojenkäsit- 
telyyn, kun taas R:ää käytetään enemmän tilastotieteessä. Molemmat 
tarjoavat monipuolisia ja edistyneitä toimintoja aineiston analyysiin ja 
soveltuvat siksi hyvin määrälliseen korpustutkimukseen. 
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3.1. Avainsana-analyysi ja avaimuus 


Avainsana-analyysista on tullut yksi määrällisen korpuslingvistiikan ylei- 
simmistä menetelmistä. Varhaisimmissa tutkimuksissa avainsanoilla 
viitattiin käsitteisiin, jotka heijastavat kulttuurin tai yhteiskunnan omi- 
naisuuksia. Korpuslingvistiikassa avainsanoilla tarkoitetaan kuitenkin 
tavallisesti sanoja, jotka kuvaavat jollain tavalla merkittäviä tekstin omi- 
naisuuksia. Esimerkiksi Ivaskan (2015, 51) mukaan ”termillä avaimuus 
halutaan korostaa havaittujen erojen merkitystä avaimena sillä saavutet- 
tavaan tietoon käsillä olevan aineiston erityispiirteistä”. 

Avainsanat ovat siis sanoja, jotka jollain tavalla toimivat ”avaime- 
na” tekstiin. Menetelmää voidaan käyttää sekä tekstilajien tyypillisten 
piirteiden määrittämiseen että analysoitujen tekstien välittämien dis- 
kurssien? kuvaamiseen. Esimerkiksi Baker, Gabrielatos, Khosravinik, 
Krzyzanowsky, McEnery ja Wodak (2004) analysoivat uutistekstejä ja 
Roemer ja Wulff (2008) puolestaan opiskelijoiden esseitä. Analyysin tu- 
loksena syntyi lista näitä tekstejä kuvailevia avainsanoja. Ne jaotellaan 
usein kolmeen luokkaan: 1) erisnimiin, 2) sanoihin, jotka ihmislukijakin 
tunnistaisi avainsanoiksi ja jotka kertovat tekstin aihepiiristä, ja 3) yleisiin 
sanoihin, jotka kertovat pikemminkin tekstin tyylistä kuin aihepiiristä. 

Avainsana-analyysin lähtökohtana on, että avainsanojen keskeinen 
rooli ei ole vain sattuman tulosta aineistossa vaan avaimuus edustuu 
sanoissa, joiden esiintyminen ei ole odotusarvon mukaista. Odotusarvo 
lasketaan vertaamalla tutkimusaineiston sanojen frekvenssejä laajem- 
paan verrokki- tai referenssiaineistoon. Sanan frekvenssi on odotusarvon 
mukainen, jos se ei eroa tutkimus- ja verrokkiaineiston välillä. Avain- 
sanat puolestaan esiintyvät tutkimusaineistossa odotusarvoa enemmän 
tai vähemmän. Frekvenssierojen tilastolliseen todentamiseen käytetään 
yleensä x2-testiä tai log-uskottavuutta (engl. log likelihood). Avainsana- 
toiminto on usein valmiina korpusohjelmissa, kuten AntConcissa tai 
WordSmithissä (ks. Historiallinen korpuslingvistiikka tk.). Avainsanat 


esitetään listattuna siten, että merkittävimmät ovat listan alussa. On 
tärkeä muistaa, että avainsanoissa ovat mukana sekä positiiviset eli ai- 
neistossa yliedustetut avainsanat, joita on odotusarvoa enemmän, että 
negatiiviset eli aineistossa aliedustetut avainsanat, joita on odotusarvoa 
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vähemmän. Viimeksi mainitut kuvaavat aineistoa kääntäen, eli niiden 
poissaolo on siinä tyypillistä. 

Avainsanojen määrittäminen vertaamalla tutkitun aineiston sanastoa 
verrokkiaineiston sanastoon on ehdottomasti tavallisin tapa laskea ne. 
Tästä huolimatta tällä menetelmällä on selviä puutteita. Ensinnäkin se 
käsittelee koko aineistoa yhtenä kokonaisuutena. Tämä on ongelmallis- 
ta, jos aineiston tekstit ovat keskenään erilaisia. Esimerkiksi tietyt sa- 
nat saattavat olla joissain tutkimusaineiston teksteissä erittäin yleisiä 
mutta toisissa taas harvinaisia. Kun avainsanat lasketaan yhdistämällä 
kaikki aineiston tekstit yhdeksi kokonaisuudeksi, nämä erot yksittäisten 
tekstien välillä eivät näy tuloksissa. Toiseksi sanastojen välisten erojen 
tarkastelu tilastollisella todennäköisyydellä voi olla harhaanjohtavaa suu- 
rissa aineistoissa. Tutkimusaineiston ja verrokkiaineiston suuren koon 
takia pienetkin erot sanastoissa voivat olla tilastollisesti merkitseviä, eli 
sanastojen frekvenssierot eivät ole sattuman tulosta. Tilastollinen mer- 
kitsevyys ei kuitenkaan tarkoita sitä, että sanastojen väliset erot olisivat 
automaattisesti merkitseviä tutkimuskysymysten kannalta. 

Analyysimenetelmän puutteiden kehittämiseksi on ehdotettu erilaisia 
ratkaisuja. Esimerkiksi key keyword analysis -nimisessä menetelmässä 
koko aineiston avainsanat kerätään joukosta niitä sanoja, jotka ovat avai- 
mia myös yksittäisissä teksteissä. Näin tekstien väliset erot eivät pääse 
vääristämään tuloksia. Toisaalta tilastollisten menetelmien parantami- 
sen sijaan voi olla yksinkertaisempaa soveltaa ohjattua koneoppimista 
avaimuuden tutkimiseen. Tarkastelemme tätä lähestymistapaa tarkem- 
min luvussa 3.3. 


3.2. Kollokaatioanalyysi 


Avaimuuden lisäksi toinen perinteinen määrällisen korpustutkimuk- 
sen menetelmä on kollokaatioanalyysi. Jo korpustutkimuksen var- 
haisvaiheissa J. R. Firth määritti, että sanan tuntemiseen vaaditaan 
sen kontekstin tunteminen: ”You shall know a word by the company 
that it keeps” (Firth 1957, 6). Kollokaatio tarkoittaa siis sanojen taipu- 
musta esiintyä yhdessä. Sanaa ja sen kollokaattia eli lähiympäristössä 
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esiintyvää sanaa käytetään yhdessä odotusarvoa enemmän. Esimerkiksi 
verbin naukua subjektina voisi toimia usein kissa tai pentu, joskin myös 
ovi naukuu ja nälkä voi naukua vatsassa. Monet kollokaatit muodostavat 
pääsanansa eli rakenteen muuttumattoman ytimen kanssa vakiintuneita 
ilmauksia, kuten rauhanomainen rinnakkaiselo. 

Tavallisesti kollokaatit kertovat jotain ytimen (kuten verbin naukua) 
merkityksestä. Kollokaatioanalyysia käytetäänkin sanojen merkityksen 
eli semantiikan tutkimukseen. Voidaan ajatella, että merkitys ei rakennu 
pelkästään yksittäisistä sanoista vaan laajemmista kokonaisuuksista ja 
että sanoihin liittyy helposti niiden kollokaattien merkitystä. Esimerkiksi 
Stubbs (1995) on kollokaatioanalyysin avulla osoittanut, että englannin 
verbi cause esiintyy tyypillisesti negatiivisten ilmausten yhteydessä. 

Keskeinen käsite kollokaatioanalyysissa on semanttinen preferenssi. 
Tällä tarkoitetaan sanojen taipumusta esiintyä yhdessä keskenään sa- 
maan merkityskenttään kuuluvien sanojen kanssa. Esimerkiksi Stubbs 
(1995) raportoi englannin sanalle cause kollokaateiksi muun muassa sa- 
nat abandonment 'luovuttaminen', accident 'onnettomuus', alarm ”huoli' 
ja anger ’viha’. Nämä ovat hyviä esimerkkejä negatiivisista ilmauksista, 
jotka nousevat Stubbsin artikkelissa esiin cause-verbin kollokaatteina. 

Tietylle ytimelle tai tutkitulle sanalle voidaan myös muodostaa ns. se- 
manttinen profiili. Se koostuu korpusaineiston perusteella määritellyistä 
kollokaateista, jotka ovat ytimelle tyypillisiä. Näiden avulla voidaan paitsi 
kuvata yksittäisten sanojen merkitystä myös vertailla sanoja ja aineistoja 
toisiinsa. Esimerkiksi Jantunen (2012) analysoi tässä-pronominin kollo- 
kaatteja suppeammalle asiantuntijayleisölle tarkoitetuissa akateemisissa 
teksteissä ja laajalle yleisölle kohdennetuissa populaariteksteissä, kuten 
elämäntaito-oppaissa. Hän jakaa tässä-pronominin kollokaatit kolmeen 
ryhmään: 1) metatekstuaalisiin ilmaisuihin, joilla viitataan itse tekstis- 
sä raportoitavaan tutkimukseen (tässä kirjassa, tässä luvussa, tässä tutki- 
muksessa), 2) näkökulmaa ilmaiseviin yhteisesiintymiin (tässä perintees- 
sä, tässä kohden) ja 3) abstraktimpiin, yksittäisiin tilanteisiin viittaaviin 
konstruktioihin (tässä tapauksessa, tässä vaiheessa). 

Jantusen tulokset kertovat tässä-pronominin käytöstä ja merkityksestä 
huomattavasti enemmän kuin pelkät frekvenssit tekisivät. Myös tekstila- 
jien erot näkyvät kollokaattien frekvensseissä jonkin verran: esimerkiksi 
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metatekstuaaliset ilmaukset ovat akateemisissa teksteissä populaariteks- 
tejä yleisempiä. Tämä kertoo akateemiselle tekstille tyypillisestä tavasta 
jäsentää tekstiä lukijalle ja rakentaa sen välittämää viestiä viittaamalla 
tekstin osiin eksplisiittisesti. 

Monet yleiset korpusohjelmat, kuten AntConc, sisältävät työkalun, 
joka määrittää kollokaatit halutuille sanoille. Keskeistä tässä lähesty- 
mistavassa on se, että kollokaatioksi muodostuu sellainen sanojen yh- 
teisesiintyminen, joka poikkeaa odotusarvosta. Sanat eivät vain esiinny 
yhdessä, vaan niiden yhteisesiintyminen poikkeaa siitä, mitä voisimme 
aineiston perusteella olettaa. Tästä syystä kollokaatioanalyysi on joustava 
menetelmä ja siinä voidaan hyödyntää useita muita menetelmiä, esimer- 
kiksi log-uskottavuutta tai keskinäistä informaatioarvoa (engl. mutua! 
information) (Anthony 2014). On syytä painottaa, että eri menetelmät 
eivät välttämättä tuo esille aineistosta samoja piirteitä vaan ne saattavat 
korostaa tiettyjä osa-alueita. Esimerkiksi keskinäinen informaatioarvo 
nostaa esille kollokaatteja riippumatta sanojen havaitusta frekvenssistä, 
kun taas log-uskottavuus ottaa tämän huomioon. 


3.3. Koneoppiminen korpuslingvistiikassa 


Koneoppimisella viitataan menetelmiin, jotka hyödyntävät yleisiä algorit- 
meja, joiden tavoitteena on oppia aineistosta. Koneoppimisalgoritmi ei 
ole vain staattinen kokoelma käskyjä, jotka olisi luotu tiettyä aineistoa var- 
ten, vaan se oppii mallin aineistosta ja ennustaa tulevia toteutumia tämän 
mallin perusteella. Koneoppiminen jaetaan kahteen päätyyppiin, ohjat- 
tuun ja ohjaamattomaan. Ohjattua koneoppimista hyödynnetään silloin, 
kun tavoitteena on oppia vastemuuttuja syötteestä. Esimerkiksi vaste- 
muuttuja voisi olla sähköpostien jaottelu kahteen luokkaan, roskapostiin 
ja asiallisiin viesteihin. Ohjelman pitäisi ennustaa tämä vastemuuttuja eli 
viestin luokka sille annetun syötteen eli itse viestin perusteella. Ohjaama- 
tonta koneoppimista hyödynnetään taas silloin, kun tavoitteena on löytää 
aineistosta rakenne ilman etukäteen määriteltyjä luokkia. Tällöin esimer- 
kiksi sähköpostiviestejä voitaisiin ryhmitellä samankaltaisiin ryhmiin. 
Molemmille koneoppimistyypeille on yhteistä se, että tutkimusaineisto 
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on ensin muutettava piirteiksi. Tällä tarkoitetaan sitä, miten aineisto esi- 
tetään ohjelmalle. Piirteistys on keskeistä koneoppimisen soveltamises- 
sa kielentutkimukseen, sillä se määrää, miten tutkimusaihe muutetaan 
mitattavaan muotoon eli operationalisoidaan. Käsittelemmekin aineiston 
piirteistystä luvussa 3.3.1. Tämän jälkeen siirrymme ensin ohjattuun ja 
sitten ohjaamattomaan koneoppimiseen. 


3.3.1. AINEISTON PIIRTEISTYS ELI MITEN MUUTTAA 
TUTKIMUSAIHE MITATTAVAAN MUOTOON 

Piirteistyksen tarkoituksena on operationalisoida tutkimusaihe eli muut- 
taa se mitattavaan muotoon. Esimerkkitutkimuksessamme luvussa 4 
tarkastelemme sitä, miten köyhyydestä keskustellaan Suomi24-palstalla. 
Tätä varten ensimmäinen askel on hakea aineistosta kaikki kommen- 
tit, joissa mainitaan sana köyhä tai jokin sen lähisynonyymi. Toisin sa- 
noen köyhyyden operationalisointi aloitetaan näkemällä se kimppuna 
lekseemejä, jotka liittyvät merkityksen kannalta käsitteeseen köyhä. 
Toinen askel on muuntaa tarkasteltava kielenaines eli keskustelupalsta- 
kommentit mitattavaan muotoon ja piirteistää ne. 

Käytetyt piirteet voivat olla periaatteessa mitä tahansa. Määrällisessä 
korpuslingvistiikassa piirteiden valinta on kuitenkin yksi keskeisimmis- 
tä haasteista. Haasteellisuus piilee siinä, että toisaalta tutkimuksessa 
käytettyjen piirteiden avulla algoritmin on opittava tunnistamaan tutkit- 
tavat kielen ilmiöt, esimerkiksi roskapostiviestit tai köyhyyttä käsittelevät 
keskustelupalstakommentit, ja toisaalta piirteiden tulee olla kielitieteel- 
lisesti motivoituja. On olennaista, että piirteet kuvaavat tarkasteltavia 
ilmiöitä ja että niiden avulla saadaan uutta tietoa ilmiöistä. Tavallisesti 
piirteiden valinta perustuukin ennen kaikkea tutkimusasetelmaan, jo- 
hon vaikuttavat sekä tutkijan kielitaju (ks. Kielitaju kielentutkijan työka- 
luna tk.) että aiempi tutkimus. Tiedetään esimerkiksi, että kielen raken- 
teelliset eli morfosyntaktiset ominaisuudet vaihtelevat eri rekistereitä 
edustavissa teksteissä. Näin ollen rekistereiden kielellisiä ominaisuuksia 


tarkastelevassa tutkimuksessa nämä ominaisuudet kannattaa ottaa piir- 
teisiin mukaan. Sen sijaan esimerkiksi se, minä viikonpäivänä teksti on 
kirjoitettu, ei todennäköisesti kuvaa rekistereiden välisiä mahdollisia 
eroja, eikä tätä ominaisuutta kannata huomioida piirteistyksessä. 
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Piirteiden valintaa voi lähestyä kahdesta näkökulmasta, aineisto- 
tai teoriavetoisesti. Yksi perinteinen aineistovetoinen piirteistys on 
sanasäkkimalli (engl. bag-of-words). Tekstiaineiston, joko lauseen tai pi- 
demmän tekstin, kuten dokumentin, esitetään koostuvan ainoastaan ko- 
koelmasta sanoja ja niiden frekvensseistä. Esimerkiksi sanajärjestystä ei 
huomioida. Sanasäkkimalli voidaan toteuttaa joko sane- tai lemmatasol- 
la. Saneella tarkoitetaan sananmuodon esiintymää tekstissä, esimerkiksi 
talossa ja pihalla. Termi lemma viittaa taas sanan ns. sitaattimuotoon, 
joka edustaa tietyn sanan kaikkia taivutusmuotoja; esimerkiksi saneiden 
taloa, talosta ja taloon lemma on talo. Sanan lemmaa käytetaan tyypilli- 
sesti sanakirjoissa hakusanana. 

Sanasäkkimallin toteuttamisvalinnalla on yhtymäkohtia sekä aineis- 
toon että itse tutkimuskysymykseen. Aineiston lemmatisointi vaatii 
tietokoneavusteisen menetelmän hyödyntämistä. Lemmatisointi voi 
kuitenkin myös tuoda mukanaan virhettä aineistoon, eli menetelmä voi 
tuottaa väärän lemmamuodon saneelle. Teknisen toteutuksen lisäksi 
tutkimuskysymys ohjaa myös sanasäkkimallin toteuttamistapaa. Jos 
tutkimuskysymys liittyy kiinteästi kysymykseen mistä on kirjoitettu, ai- 
neiston lemmatisointi on hyvä lähtökohta. Jos taas tutkimuskysymys on 
pikemminkin miten on kirjoitettu, aineiston lemmatisointi voi olla on- 
gelmallista, koska lemmatisointi hävittää morfologian. Lemmatisoinnin 
merkittävin hyöty on kuitenkin siinä, että se vähentää piirteiden määrää, 
koska lemmapohjaisessa sanasäkkimallissa piirteiden määrä on sama 
kuin aineiston uniikkien lemmojen määrä. Sanepohjaisessa mallissa 
taas piirteiden määrä tulee saneiden mukaan. 

Havainnollistamme sanasäkkimallia saneilla taulukossa 2, jossa ri- 


veillä on dokumentit ja sarakkeilla saneet ja soluarvot ovat frekvenssejä. 


talossa pihalla talosta pihalta 
dokumentti 1 40 60 o o 
dokumentti 2 o o 60 80 
dokumentti 3 o 40 o 60 
dokumentti 4 120 o 60 o 


Taulukko 2. Sanasäkkimalli saneiden perusteella. 
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Frekvenssin absoluuttisen arvon perusteella dokumentit 1 ja 2 eroavat 
sijamuotojen suhteen, eli näitä dokumentteja erottaa ilmauksen funktio. 
Dokumentit 3 ja 4 puolestaan eroavat sisällön perusteella: talo versus 
piha. Taulukossa 3 on kuvattu sama aineisto lemmatisoituna. 


talo piha 
dokumentti 1 40 60 
dokumentti 2 60 80 
dokumentti 3 o 100 
dokumentti 4 180 o 


Taulukko 3. Sanasäkkimalli lemmatisoidulla aineistolla. 


Lemmatisoidussa aineistossa sisältöperusteiset erot ovat säilyneet (ks. 
dokumentti 3 ja 4) mutta morfologinen ero on kadonnut. Merkittävin 
etu lemmatisoidussa aineistossa on kuitenkin se, että piirteitä on huo- 
mattavasti vähemmän kuin sanepohjaisessa mallissa. Toisin sanoen ai- 
neisto on tiheämpää. Sanepohjaisessa sanasäkkimallissa aineisto taas on 
harvempaa, eli uniikkeja saneita on enemmän. 

Sanasäkkimallin lisäksi piirteistyksessä on mahdollista huomioida 
myös sanojen peräkkäinen yhteisesiintyminen. Tällaisia malleja kutsu- 
taan yleisnimellä n-grammimalli. Bigrammimalli perustuu kahden sa- 
nan yhteisesiintymiseen aineistossa ja trigrammi puolestaan kolmen. 
Siten aineiston esitetään koostuvan tekstissä peräkkäin esiintyvien sa- 
nojen yhdistelmistä, joissa sanojen määrä on N. Sanasäkkimalli on siis 
n-grammimallien erityistapaus, unigrammimalli. On syytä huomioida, 
että n-grammimallien tavoitteena on tavallisesti juuri aineiston piirteistys 
koneoppimista varten. Yhteisesiintymiin perustuvan kollokaattianalyysin 
(ks. luku 3.2.) tavoite puolestaan on tarkastella sanojen merkitystä. 

Tavallisesti n-grammimalli ei kuitenkaan huomioi sanojen morfo- 
logisia piirteitä tai niiden välisiä syntaktisia suhteita, jotka saattavat 
yhdistää virkkeessä toisistaan kaukanakin esiintyviä sanoja. Laippala, 
Kyröläinen, Kanerva ja Ginter (2018) laajentavat juuri n-grammimalleja 
suomen kielessä ottamalla huomioon sanojen väliset syntaktiset suh- 
teet. Tietysti erilaisia n-grammimalleja on mahdollista myös yhdistää 
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ja vertailla. Esimerkiksi Laippala, Luotolahti, Kyröläinen, Salakoski ja 
Ginter (2017) vertaavat, miten erilaiset n-grammimallit ja niiden yhdis- 
telmät soveltuvat suomenkielisessä internetissä käytettävien rekisterei- 
den tunnistamiseen. 

Sanasäkki- ja n-grammimallien kohdalla on syytä kuitenkin muistaa, 
että aineiston esikäsittelyllä on merkittävä osuus tutkimuksessa. Näin 
on erityisesti verkkoaineiston kohdalla, sillä se saattaa sisältää paljon 
analyysin kannalta ei-toivottua ainesta, joka ei lisää informaatiota vaan 
tuo mukanaan kohinaa. Esimerkiksi virke Lue lisää saattaa esiintyä 
koneellisesti kootussa aineistossa usein sivustojen teknisen toteutuk- 
sen takia (ks. myös Korpusaineistot tk.). Sillä ei kuitenkaan ole juuri- 


kaan kielentutkimuksellista selitysvoimaa, vaikkapa kielen rekisterien 
ominaispiirteiden tarkastelussa. 

Siinä missä aineistovetoisessa piirteistyksessä esimerkiksi sanasäkki- 
malli on tarkoitettu yleiseksi malliksi kieliaineiston määrälliselle korpus- 
tutkimukselle, teoriavetoisessa piirteistyksessä aineiston piirteet valitaan 
yksittäin ja piirteistys on tyypillisesti sidottu konkreettiseen tutkimus- 
kysymykseen. Esimerkiksi Helasvuo ja Kyröläinen (2016) mallintavat 
suomen kielen ensimmäisen persoonan subjektiargumentin reaalis- 
tumista keskusteluaineistossa joko pronominina (minä luen) tai nolla- 
subjektina (luen). Piirteinä käytetään aiemmissa tutkimuksissa havaittuja 
ja teoreettisesti motivoituja muuttujia. Verbeihin liittyviä piirteitä ovat 
ensinnäkin sen semanttinen luokittelu esimerkiksi kognitioverbeihin 
(ajatella) ja liikeverbeihin (juosta). Toisena piirteenä on verbien frekvens- 
si, jossa käytetään lemmamuotojen frekvenssiä. Lausetason piirteenä 
puolestaan voidaan mainita polaarisuus eli lauseen myönteinen tai kiel- 
teinen sisältö. 


3.3.2. OHJATTU KONEOPPIMINEN 

Ohjatussa koneoppimisessa oppiminen perustuu valmiisiin esimerk- 
keihin, jotka ovat usein joko tutkijan itsensä kielitajun pohjalta käsin te- 
kemiä tai peräisin valmiista aineistosta. Näiden valmiiden esimerkkien 
kokoelmaa kutsutaan harjoitusaineistoksi. Vaikkapa roskapostit tunnista- 
van ohjelman harjoitusaineisto voisi koostua viesteistä, jotka on merkit- 
ty roskaposteiksi, ja viesteistä, jotka on merkitty tavallisiksi, asiallisiksi 
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viesteiksi. Esimerkkiaineiston perusteella algoritmi pyrkii oppimaan 
luokkien ominaisuudet niin, että se pystyy luokittelemaan uudet viestit 
näihin kahteen luokkaan. Tässä luvussa keskitymme ohjatun koneoppi- 
misen soveltamiseen nimenomaan luokittelussa. Kielentutkimuksessa 
ohjattua koneoppimista ja luokittelua käytetään esimerkiksi kielivariant- 
tien tai joidenkin kielen rakenteiden ominaispiirteiden tutkimiseen. 
Esimerkiksi luvussa 3.3.1. esitelty suomen kielen subjektiargumenttien 
realisoituminen joko pronominina tai nollasubjektina voidaan nähdä 
kaksiluokkaisena luokittelutehtävänä. 

Ohjatussa oppimisessa algoritmi pyrkii oppimaan mallin, jonka 
avulla on mahdollista tunnistaa aineistossa esiintyvät luokat piirteiden 
perusteella. Täten menetelmää on mahdollista hyödyntää itse piirtei- 
den tarkasteluun, sillä ohjelma kertoo, kuinka hyvin valitut piirteet 
ennustavat luokkia. Esimerkiksi Ivaska (2015) tarkastelee väitöskirjas- 
saan suomenoppijoiden kirjoittamien tekstien morfosyntaktisia avain- 
rakenteita ja Kyröläinen (2013) taas venäjän refleksiiviverbirakenteiden 
tyypillisiä semanttisia ja syntaktisia ominaisuuksia. Samoin avainsana- 
analyysi (ks. luku 3.1.) voidaan muuttaa luokitteluongelmaksi, jossa ta- 
voitteena on oppia tunnistamaan tutkimusaineisto ja verrokkiaineisto. 
Luokittelun tuotoksena syntyy myös lista aineistojen tunnuspiirteistä, 
joita voidaan pitää luokkien avainsanoina. 

Koneoppimisen hyödyntäminen avainsana-analyysissa antaa mah- 
dollisuuksia välttää useita perinteisen, frekvenssiin perustuvan avain- 
sana-analyysin ongelmista. Ensinnäkin koneoppimisessa tavoitteena 
on tunnistaa jokainen aineiston yksikkö, esimerkiksi jokainen rekisteriä 
edustava teksti tai tutkimuskohteena olevan kielen rakenteen käyttö- 
kerta. Näin ollen koko tutkittavaa aineistoa ei käsitellä yhtenä kokonai- 
suutena, eivätkä yksittäisten tekstien tai rakenteiden kohdalla tapahtu- 
vat erot samalla tavalla vääristä tuloksia. Esimerkiksi yhdessä aineiston 
tekstissä erityisen taajaan esiintyvä sana ei todennäköisesti tällä me- 
netelmällä päädy avainsanaksi. Toinen koneoppimisen selkeä etu on, 
että luokittelijan toimintavarmuutta pystytään arvioimaan erittäin 
tarkasti saannin ja tarkkuuden avulla (Tieteen termipankki sv. saan- 
ti, tarkkuus; ks. myös kuvio 3 alla). Tämän ansiosta myös avainsano- 
jen luotettavuutta voidaan tarkastella varsin yksityiskohtaisesti. Näin 
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mitattuna toimintavarmuuteen ei myöskään vaikuta aineiston koko, jo- 
ten menetelmä soveltuu hyvin myös suurten aineistojen tarkasteluun. 
Koneoppimisen soveltaminen avaimuuden tarkasteluun on hyödyllistä 
myös siksi, että se on menetelmällisesti erittäin joustava ja sen avulla 
voidaan itse avainsanojen lisäksi tarkastella myös muita piirteitä, kuten 
lemmoja tai syntaktisia rakenteita. Tätä osa-aluetta havainnollistamme 
tarkemmin luvussa 4.3. 

Ohjattua koneoppimista ja luokittelua suorittavia menetelmiä on 
luonnollisesti useita. Kielentutkimuksessa kenties eniten on sovellettu 
satunnaismetsä-nimistä menetelmää (engl. random forest; Tagliamonte 
& Baayen 2012; Kyröläinen 2013; Ivaska 2015). Toinen usein käytetty 
algoritmi on luvussa 4.3. esittelemämme tukivektorikone (engl. support 
vector machine). Näille algoritmeille on olemassa valmiita kirjastoja sekä 
R-ympäristössä että ohjelmointikieli Pythonissa. 


3.3.3. OHJAAMATON KONEOPPIMINEN 

Ohjatun koneoppimisen lisäksi toinen yleinen koneoppimisen tyyppi 
on ohjaamaton koneoppiminen. Ohjaamattoman koneoppimisen eri 
lähestymistavoista käsittelemme tässä klusterointia ja topiikkimallin- 
tamista (engl. topic modeling). Toisin kuin ohjatussa koneoppimisessa 
klusteroinnissa ja topiikkimallintamisessa ei ole valmiita luokkia, joihin 
aineistoa jaoteltaisiin (ks. Divjak & Fieller 2014; Moisl 2015). Ohjaama- 
tonta koneoppimista hyödynnetään tyypillisesti silloin, kun tavoitteena 
on löytää aineistosta ennen tuntemattomia suhteita piirteiden avulla. 
Ohjaamaton koneoppiminen ja mallin arviointi on kuitenkin tunnetusti 
haasteellista. Siinä missä ohjatussa koneoppimisessa mallin toimivuutta 
voidaan arvioida sen perusteella, kuinka hyvin se tunnistaa etukäteen 
määritetyt luokat, ohjaamattomassa koneoppimisessa etukäteen tun- 
nettuja luokkia ei ole. 

Ohjaamattoman koneoppimisen tuloksia arvioidaan tyypillisesti kah- 
della kriteerillä. Yhtenä kriteerinä on opittujen luokkien evaluoiminen 
jollakin objektiivisella mittarilla, esimerkiksi vakauden perusteella. Tällä 
tarkoitetaan sitä, että mallin aineistosta oppimat luokat eivät radikaa- 
listi muutu, vaikka piirteiden frekvenssit aineistossa vaihtelisivat hiu- 
kan. Toisena kriteerinä on opittujen luokkien selitysvoimaisuus. Tämä 
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kriteeri on subjektiivinen: jos mallin oppimien luokkien avulla on mah- 
dollista selittää tutkittavan ilmiön ominaisuuksia, on mahdollista, että 
luokat edustavat tutkittavaa ilmiötä (ks. esim. Laippala ja muut 2018). 

Yksi tavallisimmista ohjaamattomista koneoppimismenetelmistä on 
klusterointi. Klusteroinnissa tavoitteena on jakaa aineistossa esiinty- 
vät objektit piirteiden perusteella ryhmiin, joita kutsutaan klustereiksi. 
Useimmat klusterointialgoritmit perustuvat siihen, että ne pyrkivät ja- 
kamaan aineistossa esiintyvät objektit ryhmiin siten, että tiettyyn ryh- 
mään kuuluvat objektit ovat mahdollisimman samankaltaisia keskenään 
ja toisaalta samaan ryhmään kuuluvat objektit ovat mahdollisimman 
erilaisia suhteessa muihin aineistossa esiintyviin ryhmiin. Klusteri- 
analyysissa tutkittavat objektit voivat käytännössä edustaa mitä tahansa 
kielen elementtejä aina morfologisista piirteistä ja lauseista teksteihin. 
Esimerkiksi Divjak ja Gries (2006) tarkastelevat venäjän yrittämistä il- 
maisevien verbien merkitysten samankaltaisuuksia ja eroavaisuuksia 
klusteroimalla. Heidän työssään verbien lausetason käyttökontekstit on 
piirteistetty semanttisin, morfologisin ja syntaktisin perustein. Berez ja 
Gries (2009) taas soveltavat klusterointia ja samantyyppistä piirteistystä 
tarkastellakseen englannin get 'saada' verbin eri merkityksiä. Laippala ja 
muut (2018) puolestaan hyödyntävät klusterointia suomen kielen kon- 
nektorien, kuten toisaalta ja niinpä, tarkastelemiseen. 

Toinen tavallinen ohjaamaton koneoppimismenetelmä on topiikki- 
mallintaminen. Siinä tavoitteena on mallintaa ennestään tuntemattomia 
aihepiirejä eli topiikkeja tekstiaineistosta (ks. Blei 2012). Toisin sanoen 
menetelmällä voidaan tarkastella, mitä aihepiirejä aineiston dokumentit 
käsittelevät. Topiikkimallintamista on toistaiseksi sovellettu enemmän 
muissa ihmistieteissä kuin kielentutkimuksessa. Esimerkiksi Krestel ja 
Mehta (2010) ovat käyttäneet sitä relevanttien uutisten tunnistamiseen 
viestinnän tutkimuksessa ja Ouinn ja muut (2010) Yhdysvaltojen senaa- 
tissa pidettyjen puheiden aihepiirien tarkasteluun politiikan tutkimuk- 
sessa. Margaret Roberts ja hänen tutkimusryhmänsä ovat soveltaneet 
topiikkimalleja sosiaalitieteissä (ks. Roberts, Stewart & Tingley 2016). 

Yhtenä keskeisenä erona nykyaikaisten topiikki- ja klusterimallien 
välillä on se, että tyypillisesti ns. kovaklusteroinnissa yksi objekti, kuten 
tekstidokumentti, voi kuulua samanaikaisesti vain yhteen klusteriin. 
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Topiikkimallissa taas yksittäinen teksti voi koostua useista eri topiikeis- 
ta. Jos tavoitteena on tarkastella tekstien rakentumista aihepiirien pe- 
rusteella, kovaklusterointi voi olla ongelmallista, koska yksittäiset tekstit 
voivat sisältää useita eri topiikkeja. Esimerkiksi sanomalehti voi koostua 
eri osioista, kuten urheilu, talous ja ulkomaat. Tämäntyyppiselle aineis- 
tolle topiikkimalli onkin luonteva valinta. 

Käytännössä topiikkimallin peruslähtökohtana on, että topiikki muo- 
dostuu kokoelmasta sanoja, jotka esiintyvät yhdessä samassa tekstissä 
mutta eivät välttämättä esiinny lineaarisesti yhdessä tekstitasolla. Tekni- 
semmin ajateltuna jokainen teksti on jakauma eri topiikkeja ja jokainen 
topiikki on jakauma sanoja, joita koko aineistoon kuuluu. Tiivistäen to- 
piikkimallintamisen avulla pystytään 1) oppimaan koko tekstiaineiston 
topiikkirakenne, 2) arvioimaan yksittäisten tekstidokumenttien topiik- 
kirakenne ja 3) kuvaamaan aineiston topiikit avainsanojen perusteella. 
Menetelmä antaa mahdollisuuden tarkastella tekstiaineistossa esiintyviä 
aihepiirejä toisaalta monipuolisemmin ja toisaalta yksityiskohtaisemmin 
kuin esimerkiksi perinteinen avainsana-analyysi. Viimeksi mainittuun 
verrattuna erona on myös, että topiikkimalli pyrkii oppimaan aineistossa 
esiintyvät topiikit sen perusteella, miten sanat ovat jakautuneet aineis- 
ton sisällä vertaamatta aineistoa toiseen aineistoon. 

Määrällisen korpuslingvistiikan näkökulmasta tutkimus ei välttämät- 
tä ole rajoittunut tarkastelemaan ainoastaan tietyn tekstin aihepiirejä, 
vaan erityisesti kielitieteellisesti painottuneelle tutkimusaiheelle saattaa 
olla myös oleellista tarkastella, miten aihepiireistä on kirjoitettu. Tut- 
kimuksessa voidaan esimerkiksi tarkastella, miten tekstin tietty omi- 
naisuus, kuten syntaktinen kompleksisuus, tai jokin muu metatieto 
korreloi tiettyjen topiikkien kanssa. Perinteinen topiikkimalli ei kui- 
tenkaan suoraan sovellu tähän. Tätä varten Roberts, Stewart, Tingley 
ja Airoldi (2013) ovatkin kehittäneet rakennetopiikkimallin. Se edustaa 
topiikkimallia, joka mahdollistaa tekstien rakenteellisten piirteiden tai 
muun metatiedon ottamisen huomioon topiikeissa. Algoritmi on saata- 
villa R-ympäristössä. Luvussa 4.4. tarkastelemme tekstiaineistoa juuri 
rakennetopiikkimallin avulla. 
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A. Tutkimuksen eteneminen 


Tässä luvussa havainnollistetaan esimerkkitutkimuksella yllä esi- 
tettyjen menetelmien soveltamista omaan aineistoon Unix-käyttö- 
ympäristössä. Kaikki esimerkissä käytetyt ohjelmat ja aineistot 
löytyvät GitHubista osoitteesta https://github.com/TurkuNLP/ 
Corpus-linguistics#corpus-linguistics. 

Kuten jo mainittiin, monet esitellyistä menetelmistä ovat valmiina 


korpustyökaluissa. Näiden helppokäyttöisyyden mukana tulee kuitenkin 
myös haasteita. Valmiit ohjelmat tarjoavat varsin yksipuoliset mahdol- 
lisuudet aineiston analyysiin, sillä niiden sisältämiä toimintoja ei voi 
muokata eikä niihin voi lisätä toimintoja, jotka saattaisivat omassa tut- 
kimuksessa olla tärkeitä. Lisäksi aineiston esikäsittely pitää aina tehdä 
ennen varsinaista analyysia riippumatta siitä, käyttääkö valmiita työ- 
kaluja vai itse tehtyjä ohjelmia. Lopuksi on korostettava, että valmiiden 
työkalujen käytössä on riski, ettei käyttäjä itse asiassa ymmärrä, mitä 
on tekemässä. Näiden syiden takia rohkaisemme lukijoita Unix-käyttö- 
ympäristön opetteluun. 

Esimerkkitutkimuksen tavoitteena on analysoida köyhyyskeskustelu- 
ja Suomi24-palstalla. Miten köyhyydestä puhutaan? Mitä aiheita siihen 
liittyy ja mitä niistä sanotaan? Suomi24-keskustelupalstan tekstit on luo- 
vutettu tutkimuskäyttöön, ja ne ovat saatavilla Kielipankista. Tutkimusta 
varten valtavasta Suomi24-kokoelmasta on eristetty kaikki vuonna 2014 
julkaistut kommentit, joissa mainitaan sana köyhä tai sen lähisynonyy- 
mi (esim. varaton, rutiköyhä) jossain taivutusmuodossa. Kommentteja 
on yhteensä 33 716 ja saneita (välimerkit mukaan luettuina) 3 375 171. 
Aineisto löytyy GitHubista nimellä koyha-kommentit-2014.txt.gz. Ky- 
seessä on pakattu tekstitiedosto UTF8-muodossa, mikä takaa tiedoston 
koneluettavuuden ja soveltuvuuden eri käyttöalustoille. Muototietoja si- 
sältäviä tiedostomuotoja, kuten docx-dokumentteja, ei kannata missään 
nimessä käyttää. 
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4.1. Tutkimusaineiston esikäsittely 


Esikäsittely on tärkeä osa tutkimusta, ja sen merkitys korostuu, kun tut- 
kimusaineistona on verkkoaineistojen pohjalta luotuja tekstiaineistoja. 
Esimerkiksi välimerkkien eristäminen sanoista mahdollistaa sanojen 
köyhä ja köyhä? tulkitsemisen samoiksi. Syntaksijäsennysohjelman avul- 
la voidaan juoksevien sanojen sijaan käyttää ohjelman tunnistamia lem- 
moja ja muuttaa isot kirjaimet pieniksi. 

Tässä tutkimuksessa aineisto on esikäsitelty vapaasti saatavilla ole- 
valla Finnish Dep Parser -syntaksijäsennysohjelmalla. GitHubista löyty- 
vässä aineistossa on saatavilla jokaisesta keskustelupalstakommentista 
sane, sen lemmamuoto sekä sanaluokka. Jokainen aineiston sane ja sen 
analyysit ovat omalla rivillään. Lisäksi jokaista kommenttia edeltävät sitä 
kuvaavat metatiedot: kommentin id-numero, julkaisuaika, keskustelun 
aihealue, otsikko ja kirjoittajan käyttäjätunnus. Kuviossa 1 on esitetty 
annotoitu esimerkki aineistosta. 


id: 6065527 

date: 2014-04-15T21:24:002 
sect: Paikkakunnat 
subsect: Pohjois-Pohjanmaa 
user: Maassa maan tavalla 


Putin Putin 


on olla 


raaka raaka 
diktaattori 

, , 

hän hän 
yrittänee 
vallata 
Suomenkin 


PROPN 

VERB 

NOUN 
diktaattori 
PUNCT 
PRON 
yrittää 
vallata 
Suomi 
PUNCT 


NOUN 


PROPN 


Kuvio 1. Annotoitu esimerkki aineistosta. 
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4.2. Avainsanat ja log-uskottavuus 


Tässä luvussa lasketaan aineiston avainsanat perinteisellä menetel- 
mällä, jossa kaikkia kommentteja käsitellään yhtenä kokonaisuutena 
ja avainsanat perustuvat kommenteissa yli- tai aliedustettuina oleviin 
sanoihin. Tässä tutkimuksessa tilastollinen todennäköisyys lasketaan 
log-uskottavuudella. 

Verrokkiaineiston valinta on tärkeä tekijä avainsanojen määrittämi- 
sessä, sillä se, millaiseen aineistoon tutkittavan aineiston sanastoa ver- 
rataan, vaikuttaa keskeisesti tuloksiin eli saatuihin avainsanoihin. Jos 
aineistomme Suomi24-keskusteluja verrataan esimerkiksi uutisartik- 
keleihin, tulokset kertovat ennen kaikkea keskeisistä eroista uutisten 
ja internetkeskustelujen välillä. Nyt tavoitteena on kuitenkin tarkastella 
nimenomaan köyhyyttä käsittelevien keskustelujen erityispiirteitä ja nii- 
tä käsitteitä, joita keskustelijat liittävät köyhyyteen. Tämä tavoite saavute- 
taan parhaiten vertaamalla näitä keskusteluja Suomi24-keskusteluihin 
yleensä. Tätä varten koko Suomi24-aineistosta on tehty 30 miljoonan 
saneen yleisotos, jossa kommenttien sanastoa ei ole määritelty. Tiedos- 
ton nimi GitHubissa on verrokki.txt.gz. Yleensä ajatellaan, että verrokki- 
aineiston pitäisi olla mahdollisimman suuri ja ehdottomasti selvästi 
suurempi kuin tutkitun aineiston. Koska Suomi24-aineisto käsittää 
miljardeja sanoja, ei kuitenkaan ole järkevää käyttää sitä kokonaisuu- 
dessaan. Tämän vuoksi kymmenkertaista kokoa verrattuna tutkittuun 
aineistoon voidaan pitää riittävänä. 

Avainsanojen laskemista varten GitHubista löytyy ohjelma nimeltä 
log ll.py. Kun tarvittavat tiedostot eli koyha-kommentit-2014.txt.gz ja 
verrokki.txt.gz on tallennettu samaan kansioon kuin ohjelma, se laskee 
automaattisesti avainsanat molemmille tiedostoille. Juoksevien sanei- 
den sijaan ohjelma käyttää kuitenkin tiedostojen toisessa sarakkees- 
sa olevia lemmamuotoja. Näin aineistosta saadaan tihempää. Toisin 
sanoen erilaisia muotoja on vähemmän, kun esimerkiksi saneet oli, 
lienee, olivat ja olen on muutettu lemmaksi olla. Lemmojen käyttö on 
hyvä esimerkki itse tehtyjen ohjelmien joustavuudesta, sillä esimer- 
kiksi AntConcin kanssa lemmojen käyttö saneiden sijaan ei ole yhtä 
helppoa. 
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Kuvio 2 alla näyttää otoksen ohjelman tuotoksesta. On tärkeä huomata, 
että ohjelma poistaa aineistoista automaattisesti köyhyyteen liittyvät hakusa- 
nat, joita kommenttien eristämiseen koko aineistosta käytettiin. Tuotokses- 
sa avainlemmat näkyvät tärkeysjärjestyksessä, jokainen lemma omalla rivil- 
lään. Ohjelma tuottaa sekä positiiviset eli tutkitussa aineistossa yliedustetut 
että negatiiviset eli aineistossa aliedustetut avainsanat. Jokaiselle lemmalle 
ohjelma tuottaa 1) log-uskottavuusarvon, 2) frekvenssin köyhät-aineistossa 
ja koko aineistossa yhteensä, 3) tiedon siitä, onko lemma positiivinen vai 
negatiivinen, sekä 4) itse lemman. Kuviossa 2 tärkeimmät positiiviset lem- 
mat ovat rikas, raha, |], työtön, eläke, maksaa, Kannbis, köyhyys ja ,. 


Suomi24 koyhat 
FREQ=36/68342 Neg kita 
FREQ=11003/160024 Neg ! 
11=12516.4¢ FREQ=191/35668 Neg auki 
11=10665.729 FREQ=765/39653 Neg kiinni 
.870 FREQ-5032/7059 Pos rikas 
.628 FREQ-10512/23977 Pos raha 
.378 4/14064 Neg tuputtaa 
+555 328/5868 Pos työtö 
.831 RE 997/5071 Pos eláke 
368 "R 827/25143 Pos maksaa 
2.584 " | [] 
.283 Pos r 
. 648 "RE 8 Pos tyó 
3.816 1 46/846 Pos Kannbis 
.724 FREQ-2214/3991 Pos kokoomus 
11=2653.797 FREQ=1403/1966 Pos koyhyys 
11=2599.041 FREQ=4780/12799 Pos euro 
11=2581.906 FREQ=2671/5542 Pos vara 


Kuvio 2. Köyhät-aineiston avainlemmoja log ll.py-ohjelmalla laskettuna. 


Positiivisista avainlemmoista monet kertovat aineiston aihepiiristä: on 
loogista, että köyhyyttä käsittelevissä keskusteluissa aihepiireinä ovat 
myös raha, rikkaat ja eläkeläiset. Sanan Kannbis läsnäolo listalla on hyvä 
esimerkki ongelmista, joita syntyy, kun avainsanat lasketaan aineistosta 
kokonaisuutena. Sanetta on käytetty ilmeisesti koneellisesti tuotetuissa 
kommenteissa. Itse kommentit ovat täsmälleen identtisiä, mutta ne on 
julkaistu eri aikoina. Tämän takia ne ovat päätyneet myös aineistoon 
erillisinä yksiköinä. Kommentteja on yhteensä 18, ja niissä sana Kannbis 
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mainitaan yhteensä 846 kertaa. Tämäntyyppisten "tulosten" välttämisek- 
si on mahdollista esikäsitellä aineistoa tarkemmin. 

Toinen merkittävä epäkohta kuvion 2 avainlemmoissa on välimerk- 
kien läsnäolo. Kun tutkimusaiheena on merkityksen tarkastelu isossa 
tekstiaineistossa, välimerkeillä on minimaalinen kontribuutio merki- 
tyksen muodostumiseen. Ne olisi siten hyvä poistaa jo esikäsittelyvai- 
heessa. GitHubissa on ohjelma log likelihood content words.py, joka 
laskee aineistosta avainlemmat käyttäen hyväkseen ainoastaan sanoja, 
joiden sanaluokka on substantiivi (vain yleisnimet), erisnimi, verbi tai 
adverbi. Voit itse koettaa ohjelmaa ja katsoa, miten tulokset muuttuvat! 


4.3. Avainsanat ja ohjattu koneoppiminen 


Luvussa lasketaan avainsanat köyhät-aineistolle ohjatun koneoppimisen 
avulla. Ohjelmana käytetään lineaarista tukivektorikonetta. Koneoppi- 
misluokittelijoita on monia erilaisia. Tukivektorikone on erittäin paljon 
käytetty, ja se soveltuu moniin erilaisiin luokittelutehtäviin kielitieteestä 
biologiaan. Lisäksi se on valmiina monissa eri kirjastoissa ja paketeissa 
eri alustoille. Esimerkiksi Python-ohjelmointikielen Scikit-learn-kirjasto? 
sisältää tukivektorikoneen ja monia muita koneoppimismenetelmiä. 

Tässä tehtävässä verrokkiaineistona käytetään Suomi24-alueella julkais- 
tuja kommentteja, joissa ei mainita lemmaa köyhä tai sen lähisynonyymejä. 
Kaikista vuonna 2014 julkaistuista kommenteista otettiin tätä varten saman- 
kokoinen otos kuin köyhät-aineistosta. Luokittelijan toiminnan arviointi on 
suoraviivaisempaa, kun luokiteltavat aineistot ovat samankokoisia. Tällöin 
tiedetään, että 50 %:n tarkkuuden saavuttanut luokittelija ei oppinut ai- 
neistossa esiintyviä luokkia, sillä tämän arvon voi saavuttaa luokittelemalla 
kaikki kommentit toiseen luokkaan. Lisäksi luokittelijan harjoitusaineiston 
kokoamisessa on tärkeää, että luokat pysyvät erillään. Jos harjoitusaineis- 
toon päätyy esimerkiksi kommentteja, joihin on merkitty väärä luokka, luo- 
kittelija ei välttämättä pysty oppimaan aineiston rakennetta. 

GitHubissa tukivektorikoneen sisältämä ohjelma löytyy nimellä svm. 
py. Ohjelma ottaa syötteekseen rivitettyä aineistoa, jossa jokainen luoki- 
teltava objekti eli tässä tapauksessa Suomi24-aineistosta peräisin oleva 
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kommentti on omalla rivillään. Jokainen rivi alkaa kommenttiluokan 
kategorialla, jonka tulee olla numeerisessa muodossa. Tätä varten Git- 
Hubissa on myös tiedosto preprocess.py, joka muuttaa köyhät-aineiston 
ja verrokkiaineiston vaadittuun muotoon ja myös numeroi rivit. Köy- 
hät-aineistosta peräisin olevat kommenttirivit alkavat numerolla o ja 
verrokkiaineiston numerolla 1. Lisäksi preprocess.py poistaa kommen- 
teista sellaisiin sanaluokkiin kuuluvia sanoja, joiden ajatellaan tuovan 
vain vähän lisäarvoa tai jopa häiritsevän analyysia. Konjunktiot ovat hyvä 
esimerkki tällaisista sanoista. Tässä esimerkissä on konjunktioiden lisäk- 
si poistettu apuverbit, pronominit, välimerkit sekä rinnastus- ja alistus- 
konjunktiot. Tarkemmat ohjeet ohjelmien ajamiseen löytyvät GitHubista. 

Kuvio 3 alla esittää kuvakaappauksen luokittelijan tuotoksesta. Ensin 
molemmille kommenttiluokille, köyhät-aineistolle (0) ja verrokkiaineis- 
tolle (1), on laskettu saanti (engl. recall), tarkkuus (engl. precision) ja näi- 
den yhdistelmä, ns. f1-arvo. Saanti kuvaa sitä, kuinka suuren osan kai- 
kista luokan kommenteista luokittelija löysi. Tarkkuus taas kuvaa sitä, 
kuinka suuri osa löydetyistä kommenteista oli oikein. Support-sarake 
oikealla näyttää kommenttien määrän harjoitusaineistossa kummallekin 
luokalle erikseen ja koko aineistossa yhteensä. 


Kuvio 3. Luokittelijan suorituskyky ja avainlemmat. Luokka o on köyhät-aineisto, 
luokka 1 verrokkiaineisto. 
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Luokittelijan fr-arvon keskiarvo on 0.88 eli 88 %. Toisin sanoen kes- 
kimäärin 88 % kommenteista on tunnistettu oikeaan luokkaan. Tämä 
on ihan kelvollinen tulos. Se kertoo myös, että luokat ja niiden lemmat 
ovat oikeasti erilaisia. Jos luokkien lemmojen välillä ei olisi merkittäviä 
eroavaisuuksia, luokittelija ei pystyisi näin hyvin tunnistamaan niitä. 
Itse avainsanat antavat hyvän kuvan kommenttien sisällöstä. Verrattu- 
na edellisen luvun log-uskottavuudella laskettuihin avainsanoihin suu- 
rimmat erot näyttäisivät olevan välimerkkien ja muiden hyödyttömien 
avainsanojen, kuten Kannbis, puuttumisessa. 


4.4. Topiikkimallintaminen 


Tässä luvussa tarkastelemme köyhät-aineistoa topiikkimallin avul- 
la hyödyntäen rakennetopiikkimallia, joka on saatavilla stm-paketissa 
R-ohjelmistolle. Tavoitteena on laskea aineiston topiikit ja arvioida, 
kuinka jokin metatieto, esimerkiksi tekstin rakenne, voi vaikuttaa to- 
piikkeihin. Tässä artikkelissa keskitymme tarkastelemaan kommentin 
kirjoituskuukauden ja sanapituuden vaikutusta topiikkeihin. Ensim- 
mäisessä luvussa esittelemme aineiston muokkausta R-ympäristössä ja 
toisessa varsinaista topiikkimallintamista. 


4.4.1. TEKSTIAINEISTON MUOKKAUS 
TOPIIKKIMALLINTAMISEEN R-YMPÄRISTÖSSÄ 

Tässä luvussa esittelemme yleisellä tasolla aineiston esikäsittelyn to- 
piikkimallintamista varten. Koska topiikkimallin tavoitteena on oppia 
aineistossa esiintyvät aihepiirit, on tärkeää, että tekstiaineisto on esikä- 
sitelty perusteellisesti. Tätä varten GitHubissa on köyhät-aineisto, jonka 
tekstiaines on rajattu tiettyihin sanaluokkiin: verbi, substantiivi (vain 
yleisnimet), erisnimi, adjektiivi ja adverbi. Tämä valmiiksi esikäsitelty 
aineisto on saatavilla artikkelin Github-sivustolla (dat stm), ja sitä voi 
käyttää sellaisenaan topiikkimallintamisessa. 

Varsinaista topiikkimallintamista varten aineisto on muutettava mal- 
lin olettamaan muotoon, sanasäkkiin. Tekstin muokkauksessa olemme 
hyödyntäneet guanteda R -pakettia (versio 1.3.13), joka tarjoaa kattavan 
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tuen keskeisille korpuslingvistiikan operaatioille ja jonka käyttö on myös 
hyvin dokumentoitu. Analyysia varten tekstiaineisto on ensin muutettu 
korpukseksi. Näin saamme sekä varsinaisen tekstiaineiston että siihen 
liittyvät piirteet nivotuksi yhteen. Se käy komennolla 


corpus2014 <- corpus(dat$text, docnames = dat$doc, docvars= 
select(dat, doc, month, Nwords Log, nick, section, subsection)) 


Luotu korpus koostuu varsinaisesta tekstiaineistosta (dat$text), doku- 
menttien nimistä (dat$doc) ja muuttujista (dat, doc, month, Nwords_ 
Log, nick, section, subsection). Korpus-objektiin liittyviä komponentteja 
voi tarkastella komennolla 


summary(corpus2014) 


Yksittäisiä kommentteja voi tarkastella komennolla texts. Esimerkiksi 
kommenttia 2 voi tarkastella komennolla 


texts(corpus2014)[2] 


Tekstiaineisto muutetaan sanasäkkimuotoon, jota kutsutaan myös 
dokumentti-termi-matriisiksi tai dokumentti-piirre-matriisiksi. Köyhät- 
aineistossa kommentit vastaavat dokumentteja. Tässä muodossa 
tekstiaineiston dokumentit edustuvat riveinä ja termit eli sanat ovat 
sarakkeina. Matriisin solut vastaavat puolestaan frekvenssiä. Doku- 
mentti-termi-matriisi luodaan komennolla dfm(). Lisäksi poistamme 
mahdolliset välimerkkien ja symbolien jäänteet teksteistä argumenteilla 
remove punct ja remove symbols. 


dat dfm <- dfm(corpus2014, remove punct = TRUE, remove sym- 
bols = TRUE) 


Voimme tarkistaa, että matriisi muodostui oikein komennolla 
dim(dat dfm), joka laskee matriisin ulottuvuudet. Komento palauttaa 


arvot 32 600 ja 143 120, jotka vastaavat rivien ja sarakkeiden määriä 
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matriisissa. Aineisto on siis oikeassa muodossa, koska aineistossa 
esiintyy kommentteja 32 600 ja sanoja 143 120. Lisäksi poistamme ai- 
neistosta sanat, joiden taajuus oli alle 5 ja jotka esiintyivät alle viidessä 
kommentissa. 


dat dfm trim <- dfm trim(dat dfm, min count = 5, min docfreg 
= 5) 


Viimeisenä muokkauksena muutamme vielä dokumentti-termi-matrii- 
sin rakennetopiikkimallin olettamaan muotoon, ja samalla tuomme do- 
kumenttien metatiedot ja kielellisen rakenneinformaation aikaisemmin 
luodusta korpuksesta: 


dat stm <- convert(dat dfm trim, to = ”stm”, docvars = 
docvars(corpus2014)) 


Olemme nyt saattaneet aineiston sellaiseen muotoon, että voimme so- 
vittaa siihen rakennetopiikkimallin. Tämä menetelmä esitellään seuraa- 
vassa luvussa. 


4.4.2. TEKSTIAINEISTON TOPIIKKIMALLINTAMINEN 
Rakennetopiikkimalli sovitetaan aineistoon R:ssä komennolla stm(). On 
kuitenkin syytä mainita, että kyseessä on suurehko aineisto ja mallin 
sovittaminen vaatii useita tunteja tehokkaallakin tietokoneella. Käsitelty 
aineisto ladataan R:n istuntoon seuraavalla komennolla: 


load(”dat stm.Rda”) 
Tätä artikkelia varten sovitimme mallin seuraavalla komennolla: 
stm evex <- stm(dat stm$documents, dat. stm$vocab, K = o, init. 


type = "Spectral", prevalence = — s(Nwords Log) + s(month, df = 
4), data = dat stm$meta, seed = 12345) 


LUKU 10 MÄÄRÄLLINEN KORPUSLINGVISTIIKKA 515 


Rakennetopiikkimallintamista varten komento kattaa kaikki keskei- 
set osa-alueet. Ensin on määritelty aineistossa esiintyvät kommentit 
(dat stm$documents) ja sanasto (dat stm$vocab), joiden perusteella 
malli laskee topiikit. Koska kyseessä on rakennetopiikkimalli, kommen- 
nossa on mukana prevalence-argumentti. Tämän avulla voimme ottaa 
topiikkien estimoinnissa huomioon, että topiikkien esiintymismäärään 
saattaa vaikuttaa jokin muuttuja. Tässä analyysissa otamme huomioon 
kommentin sanapituuden ilmaistuna log-yksikköinä (Nwords Log) ja 
kommentin kirjoitusajankohdan ilmaistuna kuukautena (month). 

Rakennetopiikkimalli ei oleta, että muuttujien, kuten sanapituuden 
tai kuukauden, välinen suhde olisi lineaarinen topiikkien esiintymis- 
frekvenssin kanssa. Ajallisessa aineistossa sanojen frekvenssi ei tyypillises- 
ti ole vakio vaan niiden käyttö vaihtelee. Jotta voimme mallintaa frekvens- 
sin ja ajan suhdetta mahdollisimman tarkasti, on tärkeää ottaa huomioon 
mahdollinen ajan ja frekvenssin välisen suhteen epälineaarisuus. Kattava 
johdatus näihin malleihin R-ympäristössä on esitetty Simon Woodin teok- 
sessa Generalized Additive Models: An Introduction with R (2017). 

Funktio s() sisältää argumentin df, joka kontrolloi muuttujan epälineaa- 
risuutta. On myös mahdollista sovittaa lineaarinen malli, jolloin funktio 
s() jätetään pois kommennosta. Oletusarvoisesti df saa arvon 10, mutta 
kuukausi-muuttujan kohdalla arvo on laskettu, koska kuukausi sisältää 
vain 12 uniikkia arvoa. Lisäksi prevalence-argumentti vaatii metatietojen 
lähteeksi objektin, joka spesifioidaan argumentilla data = dat stm$meta. 

On syytä muistaa, että kyseinen s-funktio edustaa aineistovetoista 
menetelmää, jossa kuukauden tai sanapituuden epälineaarisuus esti- 
moidaan aineistosta (ks. Wood 2017). Topiikkimallien kohdalla ei ole 
yksiselitteistä menetelmää, jonka avulla voisi valita optimaalisen ar- 
von df-argumentille. Tässä tapauksessa valitsemme arvon 4, koska se 
heijastaa ainakin osittain kommenttien epälineaarista taajuutta aineis- 
tossa: Tammikuussa oli yhteensä 1 382 kommenttia, mutta komment- 
tien taajus notkahti helmikuussa, jolloin niitä oli 1 282. Tämän jälkeen 
kommenttien taajuus lähti kasvuun ja saavutti yhden kasvupisteen 
huhtikuussa (4 202 kommenttia), jonka jälkeen kommenttien määrä 
lähti selvään laskuun saavuttaen matalimman pisteen lomakuukautena 
heinäkuussa (464). Lopuksi kommenttien määrä lähti taas nousemaan 
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saavuttaen huipun joulukuussa (4 722). Mallintamisemme tavoitteena 
on siten sovittaa aineistoon tarpeeksi joustava malli, jotta se heijastaisi 
aineistoa mahdollisimman tarkasti. On kuitenkin syytä muistaa, että 
topiikkimallintamisen yhteydessä tavoitteenamme on tarkastella, miten 
mallin estimoimat topiikit korreloivat tietyn muuttujan kanssa. 

Topiikkimallintamisen yhtenä haasteena on, että mallit olettavat, että 
topiikkien määrä (k) on etukäteen määritelty. Tässä artikkelissa käytetty 
rakennetopiikkimalli pyrkii arvioimaan aineiston perusteella topiikkien 
määrän. Tämä menetelmä toimii parhaiten isojen aineistojen kanssa 
ja sitä hyödynnetään valitsemalla k-argumentille arvo nolla ja aloitus- 
menetelmäksi Spectral (init.type = ”Spectral”). Lopuksi on syytä muis- 
taa, että topiikkimallit ovat stokastisia eli algoritmin tulokset saattavat 
erota ajokertojen välillä. Tämän vuoksi komennossa on argumentti seed, 
joka spesifioi satunnaisgeneraattorin aloituksen. 

Rakennetopiikkimalli estimoi, että aineisto koostuu 46 topiikista. 
Keskeinen kysymys on tietysti, mitä tuloksena saadut topiikit tarkoit- 
tavat. R-paketti stm sisältää useita valmiita funktioita, joiden avulla on 
mahdollista tarkastella rakennetopiikkimallin tuloksia. Topiikkien ar- 
viointia varten voidaan laskea ja visualisoida niiden avainsanat. Tämä 
tapahtuu seuraavalla komennolla (ks. kuvio 4): 


plot(stm evex, type = ”summary”, n = 25, xlim = c(o, 1), labeltype 
= "prob", topics = c(22:36)) 


— Topic 32: kone, ajella, malli, tonni, puhelin, tietokone, liikenne, merkki, käyttö, mersu 
— Topic 24: suomi, eu, ruotsi, ulkomaa, eurooppa, viro, kieli, saksa, ulkomaalainen, kansalainen 

— Topic 30: kateellinen, kateus, järki, henkilö, kuva, huudella, sääli, säälittävä, lihava, päätellä 

— Topic 36: euro, asunto, vuokra, kuukausi, talo, summa, helsinki, kuu, leipäjono, asumistuki 

— Topic 35: valtio, yritys, talous, yrittäjä, julkinen, tuottaa, tukea, kansalainen, yksityinen, sektori 

— Topic 26: ruoka, nälkä, leipä, kahvi, liha, alkoholi, tupakka, kala, peruna, viikko 

— Topic 28: paska, luuseri, sentään, perse, hullu, homma, haista, naama, loinen, kalja 

— Topic 33: tuki, yhteiskunta, sossu, toimeentulotuki, kela, asiakas, kustantaa, lapsilisä, kuukausi, päätös 

— Topic 29: perhe, nuori, turha, koti, hoito, vastaus, aikuinen, huonosti, kysymys, hankinta 

— Topic 25: harrastaa, homo, harrastus, tyttö, seksi, avioliitto, kiusata, rakkaus, parisuhde, kumppani 

— Topic 27: jeesus, gt, valtakunta, aabraham, lasarus, sielu, paavali, juutalainen, kuollut, rikas 

— Topic 34: poliisi, pelkästään, pyöriä, peli, ohjelma, piiri, lista, kadota, päteä, pelko 

— Topic 23: kokoomuslainen, kansanedustaja, poliitikko, virka, vähäosainen, kansanosa, matti, räty, kommari, vasemmistolainen 
— Topic 31: http, kotimaa, kerjätä, amp, maahanmuutto, hallaaho, toimittaja, uutiset, wiki, kerjäläinen 

— Topic 22: arvo, arvokas, presidentti, abortti, isäntä, halonen, punikki, paavo, arvoton, esko 
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Odotettu topiikkiosuus 


Kuvio 4. Topiikkien 22-36 estimoidut avainsanat. 
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Avainsanojen perusteella voi ensinnäkin todeta, että malli näyttää var- 
sin onnistuneelta. Monien topiikkien avainsanoista voi hyvin päätellä 
niiden edustaman aihepiirin. Esimerkiksi topiikin 26 avainsanat ruoka, 
nälkä, leipä, kahvi, liha, alkoholi ja tupakka kertovat selvästi, mistä tässä 
topiikissa puhutaan. Topiikin 28 alatyyliset ja halventavat avainsanat 
taas kertovat köyhyyteen liittyvistä asenteista ja eriarvoisuudesta. 
Avainsanojen ohella rakennetopiikkimallista voi tutkia, miten muut- 
tujat vaikuttavat topiikkien esiintymisfrekvenssiin. Ensin estimoimme 
muuttujan ja kaikkien topiikkien välisen suhteen komennolla 


prep <- estimateEffect(1:46 ~ s(Nwords Log) + s(month, df = 4), 
stm evex, meta = dat stm$meta) 


Funktiossa estimateEffect() spesifioidaan ensin kaikki topiikit (1:46) ja 
sitten muuttujat. Tämän jälkeen on mahdollista verrata tiettyjä topiik- 
keja keskenään. Tässä tapauksessa käytämme muuttujina kommen- 
tin kirjoitusajankohtaa ja vertaamme keskenään topiikkeja 28 ja 36 
komennolla: 


plot(prep, "month", method = "continuous", topics = c(28, 36)) 


Topiikin esiintymisfrekvenssin ja kirjoitusajankohdan korrelaatio on 
visualisoitu kuviossa 5. 


m Topic 28 " 
m Topic 36 eine eae 


Expected Topic Proportion 


0.025 


0.020 


Kommentin kirjoitusajankohta kuukausina 


Kuvio 5. Kommentin kirjoitusajakohdan vaikutus topiikkien 28 ja 36 esiintymis- 
frekvenssiin. 
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Topiikin 28 esiintymisfrekvenssi ei paljoakaan vaihtele kuukausittain, ja 
kommenttien määrä näyttää pysyvän suhteellisen tasaisena. Topiikkissa 
36 puolestaan näkyy esiintymien selvä sesonkiluonteisuus, sillä kom- 
menttien määrä on suurempi heinä- ja elokuussa. 

Olemme esitelleet lyhyesti tässä artikkelissa topiikkimallin ja sen yh- 
den sovelluksen R-ympäristössä. Rakennetopiikkimalli on hyvin doku- 
mentoitu, ja se sisältää kattavan määrän funktioita, joilla voi tarkastella 
tekstiaineistoja. Rakennetopiikkimalli avaa monipuolisen näkymän jä- 
sentämättömään tekstiaineistoon, ja tässä osuudessa olemme käyneet 
läpi sen keskeisimmät ominaisuudet kielellisen analyysin kannalta. 


5. Yhteenveto 


Tässä artikkelissa olemme esitelleet määrällistä korpuslingvistiikkaa 
ja sen menetelmiä. Määrällisessä korpuslingvistiikassa tyypilliset tut- 
kimuskysymykset liittyvät joko muotojen variaatioon tai merkitysten 
rakentumiseen muotojen kautta. Tutkimusparadigmana määrällinen 
korpuslingvistiikka yhdistää kielitiedettä ja laskennallisia menetelmiä ti- 
lastollisista menetelmistä koneoppimiseen. Menetelmällisen rikkauden 
ansiosta määrällinen korpuslingvistiikka tarjoaa kiehtovan näkökulman 
kieleen. 

Korpuslingvistiikkaan yhdistyy läheisesti tietotekniikka. Tässä luvussa 
olemme näyttäneet myös käytännössä, miten tietotekniikkaa voidaan 
soveltaa korpuslingvistiikan kysymyksiin. Lisäksi tietotekniikan kehitys 
pitää korpuslingvistiikan jatkuvassa liikkeessä, sillä uusia menetelmiä ja 
mahdollisuuksia syntyy koko ajan. Tästä syystä mekin olemme esitelleet 
erilaisia koneoppimismenetelmiä. Vaikka niitä ei välttämättä vielä käy- 
tetä laajasti, voidaan olettaa, että tulevaisuudessa niiden suosio kasvaa. 
Esimerkiksi topiikkimallintamisella on laajasti sovellusmahdollisuuksia 
kielentutkimuksessa. 
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Työkaluja 


Korpustyökaluja: 
e AntConc: http://www.laurenceanthony.net/software/antconc/ 


e COPweb: http://www.research.lancs.ac.uk/portal/en/upmprojects/ 


cqpweb (855e22e7-97fb-4863-9101-9b245729ccbd).html 
e VARD 2 -työkalu historiallisten tekstien kirjoitusasun 


standardisointiin: http: //ucrel.lancs.ac.uk/vard/ 


e WordSmith Tools: http: //www.lexically.net/wordsmith/ 
* R:n NLP paketteja: https: //cran.r-project.org/web/views/ 


NaturalLanguageProcessing.html 


Laskennallisia tyókaluja: 
e SPSS: https://www.ibm.com/analytics/spss-statistics-software/ 
e VARBRUL: https://en.wikipedia.org/wiki/Variable rules analysis 


Ohjelmointikieliä: 

e Python: https://www.python.org/ 

+ R-project: https://www.r-project.org 

+ ggplotz: https://ggplot2.tidyverse.org (monipuolinen grafiikkapaketti 


R:ään) 
e tidyverse: https://www.tidyverse.org/ (R-pakettikokoelma aineiston 


muokkaamiseen, mallintamiseen ja visualisointiin) 
e Scikit-learn -kirjasto: http://scikit-learn.org/stable/ 


Työkaluja puhutun aineiston käsittelyyn: 
e ELAN: https://tla.mpi.nl/tools/tla-tools/elan/ 
e Praat: http://www.fon.hum.uva.nl/praat/ 


Työkaluja typologiseen ja historiallis-vertailevaan tutkimukseen: 
e Max Planck Institute for Evolutionary Anthropology, Department 
of Linguistics: https://www.eva.mpg.de/lingua/tools-at-lingboard/ 
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e DatSemShifts, Database of Semantic Shifts: http://datsemshift.ru 
e Database of cross-linguistic colexifications: https://clics.clld.org 


* Leipzigin glossausohjeet: https://www.eva.mpg.de/lingua/ 
resources/glossing-rules.php 


Aiheesta lisää: 


Biber, Douglas & Reppen, Randi. 2015. The Cambridge Handbook of 
English Corpus Linguistics. Cambridge: Cambridge University Press. 


Bird, Steven, Klein, Ewan & Loper, Edward. 2009. Natural Language 
Processing with Python: {A}analyzing Text with the Natural Language 
Toolkit. Sebastopol: O'Reilly Media, Inc. 


Jockers, Matthew L. 2014. Text Analysis with R for Students of Literature. 
New York (NY): Springer. 


Manning, Christopher, Raghavan, Prabhakar & Schütze, Hinrich. 2008. 
Information Retrieval. Cambridge: Cambridge University Press. 


VIITTEET 


1 https://www.kielipankki.fi/aineistot/oulu/ 
2 Tässä termi diskurssi määritellään näin: ”a set of meanings, metaphors, representations, 


images, stories, statements and so on that in some way together produce a particular 
version of events” (Burr 1995, 48). 
3 http://scikit-learn.org/stable/. 
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Mikä? 


Historiallinen korpuslingvistiikka tarjoaa menetelmän eri kielten histo- 
rian ja muutoksen tutkimiseen laajojen, systemaattisesti koottujen elekt- 
ronisten tekstikokoelmien avulla. Menetelmässä yhdistyvät laadullinen 
ja määrällinen näkökulma, ja siinä korostuu tutkittavan aineiston tarkka 
tuntemus. Historiallisen korpuslingvistiikan menetelmin voidaan saa- 
da uutta tietoa paitsi kielestä järjestelmänä myös ihmisyhteisöjen kieli- 
käytäntöjen vaihtelusta ja muutoksesta. 


Katso myös: 

Luku 7 Laadullinen aineistopohjainen kielentutkimus 
Luku 9 Korpusaineistot 

Luku 10 Määrällinen korpuslingvistiikka 


Luku 15 Historiallinen ja vertaileva kielentutkimus 
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1. Johdanto 


Kielen varhaisvaiheiden tutkimus on lähtökohtaisesti aina aineisto- 
pohjaista. Oli kyseessä sitten yksittäisen kielen muutos ajassa tai ko- 
konaisen kielikunnan varhaisimman oletetun vaiheen, protokielen, 
rekonstruktio, tutkimus pohjautuu aina olemassa oleviin, usein sattu- 
malta nykyaikaan saakka säilyneisiin teksteihin. Historiallinen korpus- 
lingvistiikka on menetelmä, jonka avulla voidaan systemaattisesti tutkia 
eri kielten varhaisempia vaiheita monesta eri näkökulmasta. Kyseessä 
on empiirinen metodologia, jossa tutkittavan kieliaineiston niukkuus 
voi toisinaan asettaa tutkimukselle tiettyjä rajoituksia ja haasteita mutta 
tarjoaa samalla mahdollisuuden tarkastella paitsi hyvin yksityiskohtaisia 
kielioppiin, kielenmuutokseen ja kielen käyttöön liittyviä kysymyksiä 
myös abstraktimpia, perustavanlaatuisia kysymyksiä kielestä dynaami- 
sena, ajassa muuttuvana ilmiönä. Yksityiskohtaisemmat, mikrotason 
tutkimuskysymykset, jotka kiinnostavat historiallisia korpuslingvistejä, 
voivat koskea esimerkiksi kielen taivutusjärjestelmän, apuverbirakentei- 
den tai sanajärjestyksen vaihtelua ja muutosta. Laajempia, makrotason 
teemoja, joihin on viime aikoina alettu kiinnittää yhä tarkempaa huo- 
miota, ovat esimerkiksi seuraavat kysymykset: 


1) Mitkä kielensisäiset tekijät edistävät kielenmuutosta ja millä 
tavoin? 

2) Mitkä kielenulkoiset tekijät, kuten eri kieltä puhuvien ihmis- 
ten väliset kontaktit ja kieliyhteisöjen rakenne, vaikuttavat 
kielenmuutokseen? 

3) Millaiset ihmiset tai ihmisryhmät omaksuvat erityisen nopeasti 
uusia tapoja käyttää kieltä ja tällä tavoin edesauttavat kielenmuu- 
toksen leviämistä? Ketkä ovat konservatiivisia kielenkäyttäjiä? 


Kuten näistä teemoista käy ilmi, suuri osa historiallisista korpusling- 
visteistä on kiinnostunut nimenomaan siitä, millä tavoin ja missä olo- 
suhteissa kieli muuttuu ajan saatossa. Tutkimuksen näkökulma on siis 
usein diakroninen, mutta kielten varhaisempia vaiheita on mahdollista 
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tarkastella myös synkronisesta näkökulmasta, ikään kuin läpileikkaukse- 
na tiettynä aikakautena puhutusta kielestä. Oli näkökulma kumpi hyvän- 
sä, tutkija joutuu työssään ottamaan huomioon monenlaisia niin aineis- 
ton edustavuuteen kuin korpuslingvistiseen menetelmäänkin liittyviä 
asioita, jotka vaikuttavat siihen, millaisia kysymyksiä korpusaineiston 
avulla on ensinnäkin mahdollista tutkia, sekä siihen, millaisia johto- 
päätöksiä tulosten pohjalta voidaan esittää. Tutkijan vastuu on erityisen 
suuri silloin, kun käytössä on vain niukka ja tyylikirjoltaan suppea tai 
epäyhtenäinen aineisto, jonka perusteella on hankala tarkastella kielen- 
muutokseen liittyviä yleisluontoisia hypoteeseja (ks. luku 2). 

Yksi historiallisen korpuslingvistiikan suurimmista eduista on sen 
tarjoama mahdollisuus kielen ilmiöiden yleisyyden eli frekvenssin tar- 
kasteluun. Frekvenssitietojen avulla tutkija voi tehdä tarkkoja havain- 
toja ajassa vähitellen tapahtuvista muutoksista sekä tarkastella sellaisia 
kielen ilmiöitä, jotka eivät ilmene kategorisina joko-tai-jakoina vaan 
pikemminkin kielenkäytössä esiintyvinä tendensseinä, joiden ajallinen 
muutos voi lopulta johtaa koko kielioppijärjestelmän muuttumiseen. 
Koska korpusaineistossa on aina myös sattumanvaraista vaihtelua, tut- 
kijat hyödyntävät tällaisten kielenmuutosten tutkimuksessa usein tilas- 
tollisia menetelmiä, joiden avulla voidaan esittää todennäköisyys sille, 
onko esimerkiksi kahtena eri aikakautena havaittavassa kielenmuutok- 
sessa kyse todellisesta kielioppijärjestelmän muutoksesta vai onko kyse 
vain kielenkäyttöön luonnollisesti kuuluvasta vaihtelusta. Esittelemme 
joitain historiallisessa korpustutkimuksessa yleisesti käytettyjä tilastol- 
lisia menetelmiä myöhemmin tässä artikkelissa. Tässä yhteydessä on 
syytä todeta, että tilastollisten menetelmien käyttö ei historiallisessa 
korpuslingvistiikassa ole pakollinen osa tutkimusta. On mahdollista, 
että kielenmuutos etenee ajassa niin selkeästi, että tulokset ikään kuin 
”puhuvat puolestaan”. Tilastollisia menetelmiä ei kuitenkaan ole syytä 
karttaa tai pelätä: tutkijoiden käytössä on nykyään monia helppokäyttöi- 
siä tilastollisia testejä, jotka voivat tarjota aineistosta arvokasta lisätietoa. 

Monet historiallista korpuslingvistiikkaa koskevista eduista, haas- 
teista ja rajoitteista koskevat korpuslingvistiikkaa yleisemminkin (ks. 
Korpusaineistot tässä kirjassa). Nykykielen tutkimuksesta poiketen 
kielen varhaisempien vaiheiden tutkijat eivät kuitenkaan voi täydentää 
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korpusaineiston kautta saamaansa käsitystä kielen rakenteesta ja sen 
muutoksesta konsultoimalla kielen puhujia. Tätä voidaan pitää sekä 
etuna että haittana: yhtäältä on selvää, että kielenpuhujien intuitiot ja 
näkemykset omasta kielestään voivat tarjota arvokasta tietoa. Toisaalta 
on myös selvää, että puhujien intuitiot eivät aina pidä paikkaansa ja että 
heidän käsityksensä niin omasta kuin muidenkin ihmisten kielenkäy- 
töstä voivat olla virheellisiä. Tästä näkökulmasta historiallinen korpus- 
lingvistiikka näyttäytyy erityisen vahvasti aineistopohjaisena menetelmä- 
nä. Menetelmän aineistolähtöisyys ei kuitenkaan tarkoita sitä, etteivätkö 
historialliset korpuslingvistit voisi selittää tuloksiaan esimerkiksi kogni- 
tiivisesta tai sosiolingvistisestä näkökulmasta: vaikka tutkijoilla ei ole 
pääsyä menneinä aikoina eläneiden ihmisten ajatuksiin, psykologisiin 
prosesseihin ja käyttäytymismalleihin (esimerkiksi psykologisten tes- 
tien, kielitajun, kyselytutkimusten tai havainnoinnin avulla), on oletetta- 
vaa, että esimerkiksi ihmisen aivotoiminta on biologisesta näkökulmas- 
ta ollut samanlaista koko kirjoitetun, n. 5 ooo vuoden päähän yltävän 
historian ajan. Myös ihmisyhteisöjen ja ihmisten sosiaalisten roolien 
tarkka tutkimus ja ymmärtäminen tarjoavat mahdollisuuden selittää var- 
haisempien kieliyhteisöjen kielenkäyttöä ja sitä kautta kielenmuutoksen 
ulkoisia tekijöitä. 

Historiallisen korpusaineiston avulla voidaan myös tarkastella ihmi- 
sen kognitioon ja kielenmuutokseen liittyviä yleisiä prosesseja. Yksi var- 
sin paljon tutkittu esimerkki tällaisesta prosessista on merkitysten ns. 
subjektifikaatio, mikä tarkoittaa sitä, että ihmisillä on tapana alkaa käyt- 
tää sanoja ja rakenteita yhä enemmän omien mielipiteidensä, asentei- 
densa ja olettamustensa ilmaisuun — merkitykset ikään kuin hivuttautu- 
vat lähemmäksi kielenpuhujaa, kielenkäytön subjektia (Benveniste 1971 
[1958]: le sujet de Venonciation). Esimerkiksi englannin kielessä yleisesti 
käytettyä be going to -rakennetta käytettiin alun perin ilmaisemaan vain 
fyysistä liikettä (esim. She's going to the market), kun taas nykyenglannis- 
sa rakennetta käytetään yleisemmin ilmaisemaan asioita, joita kielen- 
puhuja joko olettaa tapahtuvan tulevaisuudessa tai joiden tapahtumises- 
ta hän on epävarma (esim. It's going to rain; Are you going to come to the 
party?). Vaikka tällaisia havaintoja kielenmuutoksesta ja sen luonteesta 
on mahdollista tehdä myös ilman korpusaineistoja, korpuslingvistiikka 
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tarjoaa monipuolisen menetelmän, jonka avulla voidaan hyvinkin tar- 
kasti ajoittaa kielessä tapahtuvia muutoksia sekä etsiä niitä kielenkäytön 
konteksteja, jotka ovat olleet erityisen suotuisia muutoksen etenemiselle. 

On syytä painottaa, että historiallinen korpuslingvistiikka on mene- 
telmänä täysin riippumaton tutkittavasta kielestä — mitä tahansa kieltä, 
josta on koottu historiallinen korpus, on mahdollista tutkia historialli- 
sen korpuslingvistiikan menetelmin, eikä ole lainkaan epätavallista, että 
tutkija itse koostaa korpuksen tutkimuksen kohteena olevasta kielestä. 
Koska tämän artikkelin kirjoittajien tausta on kuitenkin englannin histo- 
riallisessa kielitieteessä ja koska menetelmä on hyvin yleinen englannin 
kielen tutkimuksessa, jossa sillä on myös erityisen pitkä historia, artik- 
kelissa käytetyt esimerkit ovat pääasiassa englannin kielestä. 


2. Metodin historiaa ja taustaa 


Historiallisen korpuslingvistiikan voidaan yleisesti katsoa pohjautuvan 
aineistoperäiseen kielentutkimukseen, jota on tehty vuosisatojen ajan. 
Uuden ajan Länsi-Euroopassa tutkijoiden mielenkiinnon kohteina olivat 
etenkin klassiset kielet, latina ja klassinen kreikka, joiden pohjalta alet- 
tiin jo 1800-luvulla koostaa kattavia tekstikokoelmia. Näistä kokoelmis- 
ta on niiden ensi vaiheista lähtien käytetty nimitystä korpus, mutta on 
syytä painottaa, että korpus-termiä ei tuolloin käytetty sanan nykyisessä, 
teknisessä merkityksessä. Esimerkiksi Corpus Inscriptionum Latinarum 
-projektin pyrkimyksenä on ollut koota kaikki Rooman valtakunnan 
alueella laaditut latinankieliset piirtokirjoitukset yhteen kriittiseen edi- 
tioon riippumatta niiden kirjoitusajasta, tarkoituksesta tai kirjoituksen 
alkuperästä. Nykymerkityksessään korpuksella tarkoitetaan kuitenkin tyy- 
pillisesti tarkoin harkittujen periaatteiden mukaisesti koottua digitaalista 
kieliaineistoa: tietokoneluettavaa tekstikokoelmaa, joka sisältää ennalta 
määritellyssä ja tarkoin harkitussa suhteessa erityyppisiä tekstejä, joiden 
voidaan katsoa riittävässä laajuudessa edustavan kieltä sen eri käyttö- 
funktioissa ja rekistereissä (McEnery & Hardie 2012). Ajatuksena on 
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se, että ihmiset käyttävät kieltä hyvin eri tavoin erilaisissa konteksteissa, 
ja jos kielitieteellinen korpus sisältää liian suppean valikoiman teks- 
tejä — vaikkapa ainoastaan sanomalehtiartikkeleita — jää tutkimuksen 
tavoittamattomiin kaikki se kielen käyttöön liittyvä vaihtelu, joka nou- 
see esiin esimerkiksi epämuodollisissa keskusteluissa, sähköposteissa, 
blogikirjoituksissa tai kaunokirjallisuudessa. On toki mahdollista, että 
korpus sisältää tekstejä vain yhdestä genrestä (ks. alla). Tällöin tutkijan 
on kuitenkin varottava esittämästä liian yleisiä väitteitä kielestä aineis- 
tonsa perusteella: kielenmuutokset voivat näkyä eri genreissä eri aikoi- 
na, ja jotkin kielen rakenteet voivat olla hyvin yleisiä yhdessä genressä 
ja äärimmäisen harvinaisia toisessa. Esimerkiksi yksikön ensimmäisen 
ja toisen persoonan pronominit ovat erittäin yleisiä epämuodollisis- 
sa keskusteluissa, mutta niitä ei käytetä juuri lainkaan akateemisissa 
artikkeleissa. 

Oli kyseessä sitten useammasta genrestä koostuva yleiskorpus tai 
vain yhden genren käsittävä korpus, korpuslingvistien tavoitteena on 
aina tehdä korpuksista mahdollisimman edustavia, niin että niiden 
voidaan ajatella riittävässä määrin kuvaavan kieltä sellaisena kuin se 
tietyn kieliyhteisön moninaisissa kielenkäyttötilanteissa esiintyy (ks. 
Korpusaineistot tk.). Toinen, korpuksen edustavuuteen liittyvä ja aivan 
yhtä tärkeä pyrkimys on saavuttaa tasapaino korpuksessa esiintyvien 


tekstien välillä. Yleiskorpuksessa voidaan esimerkiksi pyrkiä siihen, 
että eri tekstilajeja, kuten akateemisia artikkeleita, aikakauslehtiä, blogi- 
tekstejä ja epämuodollista keskustelua, on korpuksessa suhteellisesti 
yhtä paljon. Korpuksen tasapainoa voidaan myös parantaa ottamal- 
la huomioon vaikkapa tekstien kirjoittajien sukupuoli ja ikä, jolloin 
korpusaineiston avulla voidaan tutkia myös sosiolingvistisiä kysymyksiä, 
kuten miesten ja naisten kielenkäyttöön liittyviä eroja. Korpuksen edus- 
tavuuteen ja tasapainoon liittyvät kysymykset koskevat niin synkronisia 
kuin diakronisia korpuksia, mutta historialliseen korpuslingvistiikkaan 
ja varsinkin diakroniseen tutkimukseen olennaisesti kuuluva aineisto- 
jen välinen vertailu korostaa entisestään näiden metodologisten perus- 
periaatteiden tärkeyttä. 

Vaatimukset korpuksen edustavuudesta ja tasapainosta otettiin 
huomioon jo 1960-luvun alussa, kun ensimmäistä nykyaikaista 
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amerikanenglannin korpusta alettiin koota Brownin yliopistossa Yh- 
dysvalloissa. Vuonna 1964 julkaistu ja yhä tutkijoiden käyttämä Brown 
Corpus' koostuu sanomalehtiteksteistä sekä kauno- ja tietokirjallisuu- 
desta, ja sen sisältämät tekstit on luokiteltu yksityiskohtaisesti ala- 
kategorioihin: korpus sisältää n. 2 ooo sanan otteita esimerkiksi scifi- ja 
seikkailukirjoista, elämäkerroista ja sanomalehtien pääkirjoituksista (ks. 
Francis ja Kucera 1979; ks. myös Korpusaineistot tk.). Kiinnostus kielen 


historiaan ja sen muutokseen johti 1990-luvun alussa uuden, samoilla 
periaatteilla toteutetun korpuksen kokoamiseen. Freiburg-Brown- eli 
Frown-korpusta? voidaan käyttää kolmekymmentä vuotta vanhem- 
man Brown-korpuksen vertailukorpuksena. Sittemmin Brown-korpus- 
perhettä on täydennetty 1960- ja 1990-luvun brittienglannin korpuk- 
silla (Lancaster-Oslo-Bergen Corpus eli LOB3; Freiburg-LOB Corpus 
eli FLOB^) sekä kahdella 1930-luvun britti- ja amerikanenglannin kor- 
puksella (BLOB-193r, The 1930s Brown Corpus eli B-Brown*). Koska 
Brown-perheen korpukset vastaavat niin hyvin toisiaan rakenteellisesti, 
ne tarjoavat erinomaisen mahdollisuuden tarkastella kielenmuutosta 
noin 60 vuoden aikavilillà seka britti- ettà amerikanenglannissa. 

Brown- ja Frown-korpukset noudattavat vaatimuksia korpuksen tasa- 
painosta ja edustavuudesta siinä määrin kuin huoliteltu yleiskieli voi 
ylipäätään antaa tarkan kuvan kielestä, sen vaihtelusta ja muutoksesta. 
Näitä korpuksen kokoamista koskevia yleisiä periaatteita on kuitenkin 
sitä hankalampi noudattaa, mitä kauemmas taaksepäin kielen histo- 
riassa menemme: vanhoja tekstejä ei yksinkertaisesti ole aina säilynyt 
riittävästi, jotta valinnanvaraa olisi. Varhaisten kielivaiheiden tutkijat 
joutuvatkin usein työskentelemään sellaisen aineiston parissa, joka on 
säilynyt osin sattumalta ja osin taas siksi, että teksti on syystä tai toisesta 
joko koettu yhteiskunnallisesti tärkeäksi ja säilyttämisen arvoiseksi tai 
tuotettu olosuhteissa, jotka ovat jostain syystä edesauttaneet sen säily- 
mistä. Valtaapitävien tekstit ovat kautta historian säilyneet huomattavas- 
ti todennäköisemmin kuin tavallisen kansan kirjoitukset, ja tämä näkyy 
myös monen historiallisen korpuksen tekstivalikoimassa: lakitekstit, 
luostarisäännöt ja raamatunkäännökset ovat yleensä varsin hyvin edus- 
tettuina, kun taas yksityishenkilöiden kirjoittamat kirjeet, päiväkirjat tai 
muut arkielämää koskevat tekstit ovat hyvin harvinaisia. 
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Myös kielen murrevaihtelu voi asettaa tutkimukselle omat haasteen- 
sa. Esimerkiksi valtaosa muinaisenglannin ajalta (n. 700—1150 jaa.) säi- 
lyneistä teksteistä on kirjoitettu Etelä-Englannissa sijainneen Wessexin 
kuningaskunnan murteella. Koska muinaisenglanniksi kirjoitettuja 
tekstejä on säilynyt nykypäivään saakka vain noin kolme miljoonaa sa- 
naa, on tämä materiaali otettu kokonaisuudessaan osaksi eräitä englan- 
nin kielen historiallisia korpuksia. Tällöin ongelmaksi muodostuu se, 
että valtaosa englannin kielen seuraavan vaiheen, keskienglannin (n. 
1150-1500 jaa.), ajalta säilyneistä teksteistä on peräisin Wessexiä poh- 
joisemmilta Itä- ja Länsi-Midlandsin alueilta. Tällaisia korpuksia työs- 
sään käyttävä kielenmuutoksen tutkija joutuukin pitämään mielessään, 
että aineistossa havaittava muutos voi selittyä sillä, että eri murteiden 
suhteellinen osuus ei ole kaikkina korpuksen edustamina aikakausina 
tasapainossa. Tilanne voi pahimmillaan vastata sitä, että suomen kielen 
lähihistoriaa tutkittaisiin vertailemalla 1800-luvun Kuopion murretta 
2000-luvun Turun murteeseen ja tämän perusteella tehtäisiin yleisluon- 
toisia, koko suomen kieltä koskevia johtopäätöksiä. 

Yksi varhaisimmista, ja samalla kunnianhimoisimmista, historial- 
lisista korpuksista on Helsinki Corpus of English Texts (HCY, jonka 
kokoaminen aloitettiin 1980-luvulla Helsingin yliopistossa professori 
Matti Rissasen johdolla. Helsinki Corpus julkaistiin vuonna 1991, ja 
sen pohjalta on sittemmin kirjoitettu satoja tieteellisiä artikkeleita, jotka 
valaisevat englannin kielessä tapahtunutta muutosta muinaisenglannis- 
ta 1700-luvulle. Korpuksen vahvuutena on sen kokoamistyössä nouda- 
tettu huolellisuus: eri aikakausien tekstit on luokiteltu yksityiskohtai- 
siin kategorioihin, ja pyrkimyksenä on ollut esittää englannin kielen 
yli tuhatvuotinen jatkumo niin, ettei kokonaiskuva liiaksi hämärtyisi 
murrevaihtelun tai tekstilajeissa tapahtuvien muutosten vuoksi. Hel- 
sinki Corpus koottiin aikana, jolloin yhteiskunnan tietokoneistuminen 
oli vasta alkanut. Tämä näkyy omalta osaltaan myös korpuksen koossa: 
korpus käsittää kaikkinensa n. 1,5 miljoonaa sanaa, mikä riittää vain 
suhteellisen yleisten kielioppi-ilmiöiden ja sanastonmuutoksen tutkimi- 
seen. Toisaalta se, mikä koossa hävitään, voitetaan tarkkuudessa. Viime 
vuosina julkaistut ns. ”megakorpukset”, kuten yli 400 miljoonaa sanaa 
vuosilta 1810-2009 käsittävä Corpus of Historical American English 
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(COHA)®, ovat kokoamisperiaatteiltaan melko suurpiirteisiä: tekstien 
kategorisointi on toteutettu karkeammin, ja koska korpuksen suuren 
koon vuoksi ei tutkijoilla ole ollut mahdollisuutta tarkastaa tekstejä ma- 
nuaalisesti, on korpuksessa jonkin verran niin tekstien ajoitusta, kirjoi- 
tusmuotoja kuin kielen varianttiakin koskevia virheitä. 

Riippumatta käytetystä korpuksesta kielentutkijan vastuulla on aina 
tuntea aineistonsa mahdollisimman tarkasti, niin että aineiston epätasa- 
paino tai eri tekstilajien konventioissa tapahtuvat muutokset eivät johda 
vääriin tulkintoihin. Esimerkiksi kaikki historialliset tekstilajit, kuten 
pyhimyselämäkerrat tai erilaiset pamfletit, eivät sellaisinaan ole säilyneet 
nykypäivään, ja tämä on hyvä pitää mielessä korpusaineistoa tutkittaessa 
(ks. myös Heikkinen, Voutilainen, Lauerma, Tiililä & Lounela 2012). 
Toisaalta voi syntyä uusia genrejä: esimerkiksi sanomalehdet kehittyi- 
vät pääasiassa 1700-luvulta lähtien, ja internetin yleistymisen myötä 
on viime vuosikymmeninä kehittynyt monia uusia tekstilajeja. Myös 
tekstilajeja koskevat käytänteet muuttuvat usein, ja tällä voi olla vaiku- 
tusta korpusaineistosta saatuihin tietoihin: esimerkiksi yksityiskirjeiden 
muodollisuus ja siihen liittyvät kielelliset piirteet sekä tieteellisen tekstin 
syntaktinen kompleksisuus ovat muuttuneet ajan saatossa. Kuitenkaan 
nämä esimerkiksi pronominien ja passiivirakenteiden frekvenssissä 
näkyvät muutokset eivät ole todiste kielenmuutoksesta vaan selittyvät 
yksittäisten tekstilajien esitystavoilla ja niihin liittyvillä muutoksilla. 

Historiallisen korpuslingvistiikan aineistojen kehityksessä on näh- 
tävissä useita eri tendenssejä. Toisaalta on saatavilla yhä suurempia 
korpuksia ja tietokantoja, kuten Farly English Books Online (EEBO) ja 
Kansalliskirjaston lehtikokoelma, jotka sisältävät massiivisen määrän 
painettuja tekstejä ja joiden avulla voidaan tutkia entistä harvinaisem- 
pia muutoksia.? Toisaalta myös pienempiä korpuksia kootaan edelleen, 
mutta niiden annotointi on aiempaa kehittyneempää: puhutaan ns. ”rik- 
kaasta datasta”, josta voi löytyä genre- ja sanaluokka-annotaation lisäksi 
vaikkapa kirjoittajien taustatietoja, tarkkoja kuvauksia tekstin asettelusta 
ja käytetyistä käsialoista tai kirjasintyypeistä sekä valokuvia alkuperäis- 
teksteistä. Siinä missä varhaiset miljoonan sanan korpukset pyrkivät 
edustamaan kieltä yleensä ja sisälsivät useita genrejä, nykyisin pienet 
korpukset keskittyvät usein vain yhteen genreen, kuten kirjeisiin (esim. 
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Corpora of Early English Correspondence, CEEC)” tai jopa yhden kir- 
joittajan teksteihin. Tällainen korpus voidaan koota myös osana opin- 
näytetyötä, jossa voidaan sitten käyttää korpusta tutkimukseen (esim. 
Marttila 2014). Sekä isoa että rikasta dataa käytetään yhä enemmän di- 
gitaalisissa ihmistieteissä yleensä, ja samoja aineistoja voivat hyödyntää 
niin historioitsija, lingvisti kuin kirjallisuudentutkijakin. 


3. Kuinka historiallista korpuslingvistiikkaa 
harjoitetaan 


3.1. Tutkimuksen kulku 


3.1.1. AINEISTON HANKKIMINEN JA KÄSITTELY 

Historiallisessa korpuslingvistiikassa tutkimus aloitetaan tyypillisesti 
tekemällä aineistosta hakuja, joilla tavoitetaan se kielenaines, jonka 
muutosta halutaan tutkia. Tarvitaan siis sopiva korpus sekä jokin haku- 
työkalu. Historialliset korpukset voidaan lajitella kahteen luokkaan: 
Alun perin diakronisiksi kootuista korpuksista (esim. Helsinki Corpus 
ja Vanhan kirjasuomen korpus)" löytyy tekstejä enemmän tai vähem- 
män tasaisesti koko niiden kattamalta aikaperiodilta. Toisaalta on myös 
synkronisia korpuksia, jotka edustavat vain yhtä ajanhetkeä mutta joita 
on myöhemmin laajennettu kokoamalla vastaava korpus eri ajanhetkel- 
tä. Jälkimmäistä tyyppiä edustaa aiemmin mainittu Brown-korpusperhe 
(ks. Korpusaineistot tk.). 

Korpuksia on saatavilla monista eri lähteistä. Esimerkiksi Kielipank- 
kiin on koottu laaja kokoelma erikielisiä korpusaineistoja. Kielipankki 
on osa FIN-CLARIN-konsortiota, joka puolestaan kuuluu eurooppalai- 
seen CLARIN-organisaatioon, jonka tarkoituksena on kehittää ja tarjota 
kieliaineistoja sekä näiden aineistojen käsittelyyn sopivia työkaluja. Kor- 
puksia voi etsiä myös metadatapalveluista. Historialliselle korpuslingvis- 
tiikalle ei vielä ole omaa palvelua, mutta yleisimpiin palveluihin lukeu- 
tuvat muiden muassa META-SHARE, CLARINin Language Resource 
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Inventory, Linguistic Data Consortiumin luettelo sekä englannin kielen 
osalta Corpus Resource Database (CoRD).5 Korpukset eivät useinkaan 
ole täysin vapaasti saatavilla mm. tekijänoikeusongelmien takia, ja osa 
niistä on maksullisia. Yliopistojen kielten laitoksilla on tyypillisesti li- 
senssejä yleisimpien korpusaineistojen käyttöön, joten ennen lisenssi- 
maksun maksamista kannattaa tarkistaa Kielipankin lisäksi oman yli- 
opiston aineistokokoelmat. 

Korpushakutyökalu tulee usein korpuksen mukana: Esimerkiksi 
COHA-korpusta voi käyttää sille räätälöidyllä web-käyttöliittymällä. Kor- 
puksen kokoaja, Mark Davies, on laatinut muitakin historiallisia korpuk- 
sia, jotka ovat kaikki käytettävissä vastaavan nettikäyttöliittymän avulla 
(esim. espanjan- ja portugalinkieliset Corpus del Espafiol ja Corpus do 
Portugués).^ Suomen web-pohjaisista palveluista mainittakoon Kieli- 


pankin Korp® (ks. myös Korpusaineistot tk.). Korp-palveluun on sovitet- 
tu useita koti- ja ulkomaisia korpuksia, joista osa on diakronisia ja osa 
synkronisia. Kansainvälisesti yleinen web-pohjainen käyttöliittymä on 
COPweb; esimerkiksi Lancasterin yliopiston COPweb-palvelimelle on 
asennettu laaja kirjo etenkin englanninkielisiä korpuksia.'* 

Joitakin korpuksia voi ladata myös omalle koneelle ja käyttää erilli- 
sen konkordanssiohjelman avulla. Tällaisia ohjelmia ovat esimerkiksi 
maksullinen WordSmith Tools ja ilmainen AntConc (kuva 1), joiden 
käyttöön on internetissä hyvät ohjeet. Konkordanssiohjelman perus- 
toimintoihin kuuluu haku, jonka tulokset näytetään yleensä kuvan 1 
tapaisena konkordanssilistauksena. Kukin hakutulos näytetään omalla 
rivillään, jonka keskellä on haettu sana, fraasi tai sanan osa, ja ympäril- 
lä konteksti, jossa hakutulos esiintyy. Ohjelmointitaitoiset voivat tehdä 
korpushakuja myös ohjelmointikielellä, vaikkapa R-ympáristóssá.'?^ Tä- 
män lähestymistavan etuja on se, että tutkija ei ole sidottu valmiissa 
korpusohjelmissa oleviin toimintoihin, sekä se, että tutkimuksen voi 
periaatteessa helposti toistaa ajamalla tutkijan käyttämän skriptin. 
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AntConc 3.4.3m (Macintosh OS X) 2014 


Concordance Plo — File View 


Concordance Hits 19974 
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File 


1 dught of Parnassus on Mount 
urs conversation with their 
nat Line - Since chang'd to 
2s is to be the Heroe. M=r= 
to it. Mr. Methuen, I hear, 
who at present do all y=e= 
5 on the twenty second that 
»rtain Earl shoud raise any 
9 f Ledep may believe so many 


10 pmmons are now faln hard to 
11 otherwise than you see. My 
12 5t Peers. We had an unlucky 
13 ed him: and what makes the 
4 d a stop put to all publick 
15 nd Advantage. I have the 
16 future. I hope to have the 


Sennis. At Florence I had tk ADDISON 003. 
Highnesses the young-Elector ADDISON_004. 
heaviness is all my Glee. I ADDISON 005. 
Dennis has a Tragedy that is ADDISON 005. 
declines his envoyship, and ADDISON 007. 
Business of it will be remov ADDISON. 098. 
determines the numbers to si ADDISON 009. 
uneasinesses in the House of ADDISON 011. 
misfortunes have raised grec ADDISON 012. 
Business since their Christa ADDISON 014. 
Business reguiring at preser ADDISON 020. 
Business about two days ago ADDISON 021. 
business y=e= worse he has c ADDISON 021. 
Businesse. His Execys howeve ADDISON 024. 
Happinesse every day to drir ADDISON 024. 
happiness of waiting on you ADDISON 026. 


ADDISON. 029.txt 
ADDISON. 030.txt 


ADDISON 031.1xt Search Term 7) Words 


Case Regex Search Window Size 


ADDISON_032.txt Advanced 50 e 

ADDISON_033.txt Y 

ADDISON.034.txt Start stop Sort 

Total No. Kodo sort 

11833 V Level 1 [1R 2) E Level2 2R $| EJ Level 3 3R 8 Clone Results 


Files Processed 


Kuva 1. AntConc-ohjelmalla on haettu CEEC-korpuksesta englannin -ness-johtimella 
muodostettuja sanoja eri kirjoitusasuineen (esim. -nes, -nis). Osumien joukossa 
on paljon roskaa, kuten erisnimiä ja -ne-loppuisten sanojen taivutusmuotoja. 


Kun alustavat haut on tehty, on hakutulokset käytävä läpi väärien osu- 
mien poistamista ja tulosten luokittelua varten (ks. Laadullinen aineis- 
topohjainen kielentutkimus tk.). Osa yllä mainituista korpuskäyttöliit- 


tymistä tukee tällaista luokittelua, mutta usein on helpompaa siirtää 
tulokset erilliseen tiedostoon, jonka voi sitten avata Excelissä tai muus- 
sa taulukkolaskentaohjelmassa ja tehdä annotoinnin siellä. Monista 
korpusohjelmista tällainen siirto- tai export-toiminto löytyykin, mutta 
esimerkiksi COHA-käyttöliittymästä tiedot on siirrettävä selaimen ko- 
piointitoimintoa käyttäen. Hakutulosten luokittelu ja siivoaminen on 
usein tutkimuksen aikaa vievin osa. 


3.1.2. TILASTOLLINEN ANALYYSI JA VISUALISOINTI 

Luokitelluista hakutuloksista voidaan siirtyä tekemään tilastollista analyy- 
sia. Tämä onnistuu valitusta menetelmästä riippuen joidenkin korpus- 
työkalujen sisällä, taulukkolaskentaohjelmilla, erityisillä tilasto-ohjelmilla, 
kuten SPSS:llä”9, tai itse ohjelmoiden (viimeiseen vaihtoehtoon hyvä opas- 
kirja on Gries 2013). Yleisin kvantitatiivinen menetelmä historiallisessa 
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korpuslingvistiikassa on laskea tutkittavan ilmiön normalisoitu frekvenssi 
aikakausittain ja vertailla frekvenssejä. Näin saadaan tietoa ilmiön esiin- 
tymistiheyden muutoksesta ajassa. Normalisoitu frekvenssi lasketaan 
jakamalla esiintymien lukumäärä koko aikakauden sanamäärällä; tämä 
voidaan kertoa vaikkapa kymmenellä tuhannella, jolloin saadaan ilmiön 
esiintyvyys kymmentä tuhatta sanaa kohti. Aikakausien sisällä voidaan 
tarkastella eri alakorpuksia, kuten genrejä tai sosiaalisia kategorioita, jol- 
loin näiden normalisoitu frekvenssi lasketaan jakamalla alakorpuksen 
esiintymien lukumäärä alakorpuksen sanamäärällä. Esimerkiksi kuvassa 
2 tarkastellaan englannin I-persoonapronominin normalisoidun frek- 
venssin muutosta ajassa naisten ja miesten alakorpuksissa. Kuvasta käy 
ilmi, että I-pronominin osuus on suurempi naisten kuin miesten kirjeis- 
sä kaikilla paitsi viimeisellä aikakaudella (ks. tietolaatikko 1). 


Tietolaatikko 1. 


* Historiallinen sosiolingvistiikka tutkii historiallisen korpuslingvistii- 
kan keinoin muun muassa sitä, miten kielenkäyttö vaihtelee eri yh- 
teiskuntaryhmien kesken ja mitkä ryhmät johtavat kielenmuutosta 
(Nevalainen & Raumolin-Brunberg 2003). 

e Vartiainen, Säily ja Hakala (2013) tutkivat englannin ensimmäisen 
ja toisen persoonan pronominien vaihtelua ja muutosta CEEC- 
korpuksessa. He havaitsivat, että naiset käyttivät näitä pronomineja 
keskimäärin enemmän kuin miehet. Tulos liittyy sukupuolittuneisiin 
kirjoitustyyleihin, joista on englannin kielestä evidenssiä vuosisatojen 
ajalta: miesten tyyli on usein informatiivisempi, naisten taas keskittyy 
enemmän vuorovaikutukseen. 

e On kuitenkin huomattava, että tyylit eivät pysy täysin muuttumatto- 
mina: esimerkiksi vaikuttaa siltä, että 1700-luvulla naisten ja miesten 
kirjoitustyylit lähenivät toisiaan. Lisäksi erot tulevat esiin vain keski- 
arvoissa, ja yksilöiden välillä on paljon vaihtelua (ks. kuva 4). Lisäksi 
kielenkäyttöön vaikuttavat tarkemmat sosiaaliset roolit: esimerkiksi 
puolisoiden välisissä kirjeissä miehet saattoivat käyttää l-pronominia 
yhtä paljon kuin naiset (Vartiainen, Säily & Hakala 2013). 


LUKU 11 HISTORIALLINEN KORPUSLINGVISTIIKKA 537 


5% 


3% 


— 
2% =M 
1% 
0% 
1600-1639 1640-1679 1680-1719 1720-1759 1760-1800 


Kuva 2. Englannin l-persoonapronominin normalisoitu frekvenssi 

(ilmaistuna prosenttiosuutena kaikista sanoista) 1600-luvulta 1800-luvulle 
CEEC-korpuksessa. Aikakaudet on jaettu alakorpuksiin kirjoittajan sukupuolen 
perusteella (F = naiset, M = miehet). 


Toinen normalisointimenetelmä otetaan käyttöön silloin, kun on ole- 
massa vaihtoehtoisia tapoja sanoa sama asia. Esimerkiksi englannin 
yksikön 3. persoonan preesensin verbipäätteestä on ollut olemassa 
kaksi eri varianttia, -s ja -th (esim. has vs. hath). Nykyään vanhempaan 
-th-muotoon törmää lähinnä enää uskonnollisissa teksteissä ja mahdol- 
lisesti joissakin englannin murteissa. Variantit muodostavat kielellisen 
muuttujan eli variaabelin, -s/-th. Kun halutaan tutkia -s:n yleistymistä 
ajassa, lasketaan sen esiintymien osuus koko variaabelista eli -s:n ja -th:n 
yhteenlasketuista esiintymistä kullakin aikakaudella (kuva 3). Huoma- 
taan, että viivadiagrammi muistuttaa muodoltaan hieman S-kirjainta: 
aluksi muutos etenee hitaasti, sitten tulee nopea vaihe, ja lopuksi muu- 
toksen eteneminen hidastuu jälleen. Monet muutokset noudattavat täl- 
laista S-käyrää, mutta jotkin saattavat tehdä jopa U-käännöksen. 
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Kuva 3. Englannin yksikön 3. persoonan preesensin verbipääte -s:n osuus variaa- 
belista -s/-th CEEC-korpuksessa, 1410?—1681 (Nevalainen & Raumolin-Brunberg 
2003). 


Korpuksen jakaminen aikakausiin eli periodisaatio on oma taiteen- 
lajinsa, jossa tasapainotellaan kuvauksen tarkkuuden ja datan määrän 
välillä. Usein korpuksen kokoajat ovat alustavasti jakaneet korpuksen 
tietynmittaisiin aikakausiin, joille he myös ilmoittavat korpuksen ma- 
nuaalissa sanamäärät. Kaudet voivat olla mielivaltaisen mittaisia, tai 
ne voivat perustua esim. kielen yleisesti tunnettuihin vaiheisiin, his- 
toriallisiin aikakausiin tai sukupolven keskimääräiseen pituuteen. Vii- 
meinen vaihtoehto on yleinen sosiolingvistisissä korpuksissa, kuten 
CEECG:ssä, joskin aineiston vähyyden vuoksi sukupolviin perustuvat 
20-vuotiskaudet joudutaan toisinaan yhdistämään 40-vuotiskausiksi (ks. 
kuvat 2 ja 3). Helsinki Corpus puolestaan on jaettu englannin yleisen 
kehityksen mukaisesti muinaisenglantiin (-1150), keskienglantiin (1150— 
1500) ja varhaisuusenglantiin (1500-1710). Nämä kaudet on jaettu edel- 
leen noin sadan vuoden mittaisiin jaksoihin, jotka ovat sopivan kokoisia 
tutkittaviksi. Toisaalta esimerkiksi Gries ja Hilpert (2012) ovat esittäneet, 
että periodisaation tulisi olla muutoskohtaista ja perustua kunkin muu- 
toksen omiin vaiheisiin; he käyttävät vaiheiden tunnistamiseen tilastol- 
lista klusterointimenetelmää (ks. Määrällinen korpuslingvistiikka tk.). 


Jos normalisoiduissa frekvensseissä havaitaan muutosta ajassa, he- 
rää heti kysymys, onko kyseessä todellinen kielenmuutos vai voisiko 
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se johtua satunnaisesta vaihtelusta tai aineiston epätasaisuudesta. Nor- 
malisoitujen frekvenssien vertailun tukena voidaan käyttää hypoteesi- 
testausta (esim. Coolidge 2013; ks. myös Määrällinen korpuslingvistiikka 


tk.), joka kertoo, onko kahden aikakauden välinen ero tilastollisesti mer- 
kitsevä. Nollahypoteesina on, että ero on sattumaa, ja ero on merkitsevä 
vain, mikäli todennäköisyys (p-arvo) sille, että nollahypoteesi hylätään 
väärin perustein, on valittua merkitsevyystasoa alhaisempi (tasona käy- 
tetään usein viittä prosenttia, p < 0,05). Todennäköisyys lasketaan mer- 
kitsevyystestillä, joita on useita erilaisia. Historiallisessa korpuslingvis- 
tiikassa on perinteisesti käytetty x*- eli khiin neliö -testiä, joka on helppo 
tehdä: tarvitsee tietää vain ilmiön esiintymien lukumäärät kummaltakin 
aikakaudelta sekä aikakausien kokonaissanamäärät, ja p-arvon voi katsoa 
taulukosta tai käyttää nettilaskuria. 

Valitettavasti x?-testi ja muut niin kutsutut sanasäkkitestit (engl. bag- 
of-words tests) eivät ota huomioon sanojen jakautumista korpuksessa, 
vaan ne olettavat, että sanat esiintyvät toisistaan riippumatta, mikä ei tie- 
tenkään pidä paikkaansa. Tämä tekee testeistä ylioptimistisia, eli ne pi- 
tävät eroa usein virheellisesti merkitsevänä. Oletetaan esimerkiksi, että 
korpuksessa on kaksi aikakautta, joissa kummassakin on 50 ooo juok- 
sevaa sanaa. Jos jokin sana esiintyy ensimmäisellä aikakaudella vaikkapa 
25 kertaa ja toisella aikakaudella vain 5 kertaa, tällaiset testit pitävät eroa 
käytännössä aina merkitsevänä (taulukko 1). Testit eivät kuitenkaan ota 
huomioon sitä mahdollisuutta, että ensimmäisen aikakauden 25 esiin- 
tymää voivat olla kaikki samassa tekstissä, jolloin korkea frekvenssi on 
pelkkää sattumaa (Säily 2014, 49). 


Aikakausi 1 Aikakausi 2 
Sana X 25 5 
Jokin muu sana kuin X 49 975 49 995 


Taulukko 1. Esimerkki khiin neliö -testissä käytettävästä kontingenssitaulusta, 
johon laitetaan sanamäärätiedot. Tilasto-ohjelman antama p-arvo on tässä 
tapauksessa 0,0005, eli x?-testin mukaan on vain 0,05 %:n mahdollisuus, että 
nollahypoteesi hylätään väärin perustein. 
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Näistä syistä korpuslingvistiikassa ollaankin siirtymässä ns. hajonta- 
tietoisiin testeihin (engl. dispersion-aware tests), joihin lukeutuvat mm. 
t-testi, Wilcoxonin järjestyssummatesti, Kendallin tau -testi ja uudelleen- 
otantaan perustuvat testit (Säily 2014, 46). Näitä testejä pystytään käyt- 
tämään siten, että ne huomioivat sanojen jakautumisen korpuksessa, 
mutta siinä tapauksessa niiden käyttö on hankalampaa, sillä syötteeksi 
eivät riitä aikakausitason frekvenssit vaan on mentävä tekstitasolle: pitää 
tietää ilmiön frekvenssi kussakin korpuksen tekstissä sekä kunkin teks- 
tin kokonaissanamäärä. Testeistä aloittelijalle helpoin ja luotettavin lie- 
nee Wilcoxonin järjestyssummatesti, toiselta nimeltään Mann Whitneyn 
U-testi (esim. Metsämuuronen 2011, 386—390, 1102-1107), jonka pystyy 
tekemään Excelissä ja jolle on myös nettilaskuri. Tilastollisen merkitse- 
vyyden osoittamiseen liittyy toki myös monimutkaistavia tekijöitä: mitä 
useampia hypoteeseja testataan, sitä suuremmalla todennäköisyydellä 
nollahypoteesi kumotaan väärin perustein. Tämän välttämiseksi voidaan 
käyttää erilaisia menetelmiä, jotka käytännössä tiukentavat merkitse- 
vyystasoa (esim. Säily 2014, 49-51). 

Historiallisessa korpuslingvistiikassa voidaan käyttää myös sofisti- 
koituneempia tilastollisia menetelmiä, joiden avulla pystytään analysoi- 
maan useiden ilmiöiden muutosta tai useita yhden ilmiön esiintyvyy- 
teen vaikuttavia tekijöitä yhtä aikaa. Tällaista monimuuttuja-analyysia on 
käytetty esimerkiksi rakennevaihtelun, kuten englannin -s- ja of-genetii- 
vien vaihtelun, tutkimiseen (Szmrecsanyi, Rosenbach, Bresnan & Wolk 
2014) sekä genremuutoksen tutkimiseen Douglas Biberin kehittämää 
piirrepatteristoa käyttäen (Biber 1988; Biber & Finegan 1997). Biberin 
multidimensionaalinen menetelmä laskee kymmenien kielenpiirteiden 
frekvenssit teksteissä ja etsii niistä faktorianalyysin keinoin piirteet, joi- 
den frekvenssit vaihtelevat samalla tavoin tekstien välillä. Näillä piirteillä 
tulkitaan olevan jokin kommunikatiivinen syy esiintyä yhdessä, ja eri 
aikakausia ja genrejä voidaan vertailla sijoittamalla ne piirteiden muo- 
dostamille rekisteriulottuvuuksille. Tämäntyyppinen tutkimus osoittaa, 
että kaikki muutos aineistossa ei ole kielenmuutosta, vaan se voi liittyä 
myös genrekonventioiden muutokseen. Esimerkiksi englannin histo- 
riassa on ollut käynnissä jo vuosisatoja kestänyt prosessi, jossa genret 
epämuodollistuvat (engl. colloguialization), jolloin niissä käytetään yhä 


LUKU 11 HISTORIALLINEN KORPUSLINGVISTIIKKA 54] 


puhekielenomaisempia piirteitä, kuten persoonapronomineja sekä ih- 
misen ajatuksiin ja mielipiteisiin liittyviä verbejä (esim. think, guess). 
Nykypäivän korpuslingvistiikassa yleiset avainsana-analyysi ja kollo- 


kaatioiden tutkimus (ks. Määrällinen korpuslingvistiikka tk.) ovat his- 
toriallisessa korpuslingvistiikassa olleet harvinaisempia, osittain aineis- 
ton vähäisyyden, osittain taas sanojen kirjoitusasujen vaihtelun takia. 
Ennen oikeinkirjoituksen standardisointia sanojen kirjoitusasuissa oli 
valtava määrä vaihtelua — esimerkiksi Parsed Corpus of Farly English 
Correspondence?" -kirjekorpuksessa (1410-1681) englannin kielen 
tomorrow-sanaa on kirjoitettu ainakin seuraavilla tavoilla: to marrow, 
to moroe, to moroughe, to morow, to morowe, to morroughe, to morrow, 
to morrowe, to morue, to morwe, to-morow, to-morowe, to-morrow, 
to-morrowe, to-morw, to-morwe, tomorow, tomorowe, tomorrow, tomorrowe, 
too morrow, toomorrow. Joistakin historiallisista korpuksista on nyt- 
temmin tehty normalisoituja versioita, joissa tekstien kirjoitusasu on 
standardisoitu esim. VARD-ohjelmalla (Baron 2011); automaattinen 
standardisointi ei kuitenkaan pure harvinaisempiin kirjoitusasuihin, jo- 
ten osa korpuksien sanoista jää edelleen standardisoimatta. Yksi harvois- 
ta historiallisista avainsana-analyyseista on Lijffijt, Säily & Nevalainen 
(2012); kollokaatioiden muutosta puolestaan ovat tutkineet mm. Baker, 
Brezina ja McEnery (2017), jotka keskittyvät 1800—1900-lukuihin, jol- 
loin englannin kirjoittaminen oli etenkin painetuissa teksteissä jo melko 
yhtenäistä. 

Tilastollisten menetelmien rinnalle tärkeiksi ovat nousemassa tiedon 
visualisoinnin menetelmät. Visualisointi on tiedon esittämistä tiiviste- 
tyssä muodossa; on osoitettu, että ihminen saa tietoa näköaistin kautta 
enemmän kuin kaikkien muiden aistien kautta yhteensä (Ware 2004). 
Yksinkertaisia, kuvien 2 ja 3 kaltaisia viivadiagrammeja voi hyvin tehdä 
vaikkapa Excelissä, mutta vaativampia visualisointeja varten tarvitaan 
jotain muuta, kuten R-ympäristössä toimiva ggplot2-kuvantamisjárjes- 
telmä.? Historiallisessa korpuslingvistiikassa on nähtävissä suuntaus 
viivadiagrammeista periodin sisäistä vaihtelua ilmentäviin kuviin, jois- 
ta yhtenä esimerkkinä mainittakoon beanplot eli papukaavio (kuva 4; 
Kampstra 2008). 
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Kuva 4. Englannin I-persoonapronominin vaihtelu ja muutos CEEC-korpuksessa 
esitettynä beanplot-kaaviona (vrt. kuva 2). Naiset punaisella, miehet sinisellä. 
(Vartiainen, Säily & Hakala 2013.) 


Kuva 4 pohjautuu samaan aineistoon kuin kuva 2, mutta se antaa pal- 
jon enemmän informaatiota. Paksut vaakaviivat kertovat I-pronominin 
mediaanifrekvenssin naisilla (vas.) ja miehillä (oik.) aikakausittain, kun 
taas kukin pienempi vaakaviiva ilmaisee pronominin normalisoidun 
frekvenssin yksittäisen henkilön kirjoittamissa teksteissä (mediaani on 
näistä havainnoista keskimmäinen). Näemme siis yhdellä silmäyksellä 
muutoksen yleiskuvan lisäksi sen, moneenko eri havaintoon mediaanit 
perustuvat: esimerkiksi keskimmäisellä kaudella naisten alakorpukses- 
sa on suhteellisen vähän havaintoja, joten emme välttämättä luota sen 
mediaaniin yhtä paljon kuin vaikkapa ensimmäisen kauden. Wilcoxonin 
järjestyssummatestin mukaan naisten ja miesten välinen ero on tilastol- 
lisesti merkitsevä kahdella ensimmäisellä kaudella (Vartiainen, Säily & 
Hakala 2013, 240). Kaaviosta näkyy myös, miten havainnot jakautuvat 
alakorpuksien sisällä. Kunkin alakorpuksen havaintojen ympärille on 
piirretty jakauma (joka kaavion kehittäjän mielestä muistuttaa pavun 
palkoa), joka osoittaa, mihin suurin osa havainnoista keskittyy. Tämä 
auttaa huomaamaan aineiston epänormaaliudet: jos esimerkiksi jokin 
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osajoukko havainnoista käyttäisi pronominia huomattavan paljon ja jo- 
kin toinen taas vähän, jakaumassa näkyisi kaksi erillistä keskittymää. 
Uusinta uutta korpuslingvistiikassa on interaktiivinen visualisoin- 
ti, ja historiallinen korpuslingvistiikka on tässäkin ajan hermolla. Esi- 
merkiksi Hilpert (2011) käyttää animoituja pistekaavioita (engl. motion 
charts), joissa kielenmuutos näkyy eri kielen ilmiöitä esittävien pistei- 
den liikkeenä kaaviossa. Pisteen koko kertoo sen normalisoidun frek- 
venssin. Kuvassa 5 näkyy joukko englannin sanoja, joita voidaan käyttää 
sekä substantiiveina (engl. nominal, y-akseli) että verbeinä (engl. verbal, 
x-akseli). Kuvasta ilmenee vuoden 1810 tilanne COHA-korpuksessa, 
mutta vasemman alakulman nuolta painamalla alkaa animaatio, joka 
osoittaa, miten sanojen käyttö muuttuu ajassa aina 2000-luvulle asti. 
Esimerkiksi love-sanaa käytetään aluksi lähinnä substantiivina, mutta 
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Kuva 5. Animoitu pistekaavio ambikategoristen sanojen muutoksesta 
COHA-korpuksessa (http://members.unine.ch/martin.hilpert/motion.html). 
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ajan myötä se muuttuu yhä ambikategorisemmaksi, eli sitä käytetään 
yhtä lailla sekä substantiivina (What is love?) että verbinä (I love you). 
Animoidut pistekaaviot auttavat tutkijaa prosessoimaan paljon tietoa te- 
hokkaasti, ja niiden avulla on helppo saada yleiskuva muutoksesta sekä 
toisaalta seurata yksittäisten sanojen tai ilmiöiden muutosta. 

On huomattava, että numerot tai kuvat itsessään eivät ole vielä tutki- 
mustulos, vaan niiden tulkinnassa tarvitaan myös laadullista tutkimusta. 
Esimerkiksi pronominitutkimuksessamme (kuvat 2 ja 4, tietolaatikko 
1) palasimme toistuvasti korpusteksteihin: luimme miesten ja naisten 
kirjoittamia kirjeitä saadaksemme selville, mistä sukupuoliero persoona- 
pronominien käytössä johtui. Tarkastelimme, miten miehet ja naiset 
käyttivät pronomineja ja miten tämä liittyi heidän sosiaalisiin rooleihin- 
sa isinä, poikina, aviomiehinä, vaimoina ja äiteinä. Havaitsimme muun 
muassa, että vaikka 1600-luvun miehet ja naiset käyttivät puolisoiden 
välisissä kirjeissä I-pronominia keskimäärin yhtä paljon, he tekivät pro- 
nominilla eri asioita: aviomiehet kertoivat tyypillisesti siitä, mitä he oli- 
vat tehneet (esim. I met my old friend), kun taas vaimot kertoivat omista 
ajatuksistaan ja tunteistaan (esim. I think); toisaalta vaimot käyttivät 
enemmän you-pronominia, koska hekin keskittyivät aviomiehen tekemi- 
siin. Lisäksi kytkimme löydökset historiallisiin konteksteihinsa, kuten 
siihen, että aviopuolisoiden välinen suhde oli tuon ajan Britanniassa 
epätasa-arvoinen ja mies oli suhteen hallitseva osapuoli. Seuraava luku 
tarjoaa lisää esimerkkejä siitä, mitä historiallisen korpuslingvistiikan 
keinoin on tutkittu. 


3.2. Mitä metodilla on tutkittu 


3.2.1. KIELIOPILLISTUMINEN 

Kieliopillistuminen on ollut yksi keskeisimmistä historiallisen korpus- 
lingvistiikan menetelmin tutkituista kielenmuutoksista. Kieliopillis- 
tumisella tarkoitetaan yleisesti ottaen ilmiötä, jossa olemassa olevan 
leksikaalisen sanan tai konstruktion merkitys muuttuu asteittain kieli- 
opillisemmaksi: konstruktiot, joilla on aiemmin viitattu konkreettisiin 
asioihin tai tapahtumiin, valjastetaan kuvaamaan yhä abstraktimpia 
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merkityksiä, kuten aikamuotoja, aspektia tai lukua. Koska tällaiset kieli- 
oppikategoriat ovat pakollinen osa kielen järjestelmää siinä mielessä, 
että kielenkäyttäjän on tyypillisesti aina kytkettävä puhunnoksensa esi- 
merkiksi oman kielensä tempus- tai aspektijärjestelmään valitsemalla 
tarkoitukseensa sopiva muoto, kieliopillistuneen konstruktion käyttö- 
taajuus on valtavasti suurempi kuin mitä sillä oli ennen kieliopillistu- 
mista. Yleistyneen käytön seurauksena konstruktiossa tapahtuu usein 
fonologisia ja morfologisia muutoksia, joissa se muuttuu foneettisesti 
yksinkertaisemmaksi sekä mahdollisesti myös vapaasta morfeemista 
sidonnaiseksi morfeemiksi. 

Esimerkiksi voidaan ottaa vaikkapa muinaisenglannin verbi willan. Se 
oli alkujaan leksikaalinen verbi, joka merkitsi tahtoa” tai haluta”, kuten 
esimerkissä 1. 


I; 
da cweep he to him, wylt pu hal beon? 
sitten | sanoa. hàn | PREP | han. haluta. sinä |terve | olla/ 
3SG.PRET DAT.M.SG 2SG.PRES tulla. 
INF? 


"Sitten hän sanoi hänelle: haluatko tulla terveeksi?" (HC, 950—1050) 


Vuosisatojen saatossa willan-verbiä alettiin käyttää yleisemmin ilmai- 
semaan tulevia, ennustettavia tapahtumia ja lopulta pelkästään tulevaa 
aikaa. Prosessin lopputuloksena verbistä tuli futuurisuutta ilmaiseva 
apuverbi (nykyenglannissa will), joka varsinkin puheessa esiintyy usein 
muodossa "ll (vrt. we will; we'll). 

Toinen esimerkki kieliopillistumiselle ominaisista semanttisista ja 
rakenteellisista muutoksista ovat englannin kielen binominaaliset kvant- 
torit (esim. a lot of N, a bit of N). Sekä lot että bit ovat näissä rakenteissa 
viitanneet alkujaan konkreettisiin asioihin: lot maapalstaan (esim. a lot 
of land) ja bit haukkapalaan (esim. a bit(e) of bread). Kieliopillistumis- 
prosessissa kielenpuhujat tulkitsivat näiden sanojen merkityksen uudel- 
leen, niin että niiden tarkoitteeseen implisiittisesti liittynyt pieni/suuri 
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koko tai määrä nousikin keskeiseksi, ja tästä seurasi konstruktioiden 
rakenteellinen uudelleentulkinta: lot- ja bit(e)-sanat eivät enää olleetkaan 
substantiivilausekkeidensa pääsanoja, vaan ne käsitettiin syntaktisesti 
osaksi monisanaista kvanttorirakennetta. Tällöin alun perin jälkimää- 
ritteen osana olleesta substantiivista tuli uudelleen tulkitun lausekkeen 
pääsana: [a lot] [of land] — [a lot of] [land]. Kieliopillistumista voidaan 
tarkastella myös käyttökontekstien laajentumisen näkökulmasta. Esi- 
merkiksi a lot (of)- ja a bit (of) -kvanttoreita on alettu käyttää myös 
muunlaisten kieliopillisten merkitysten ilmaisuun, kuten määrää ku- 
vaavina adverbeina (esim. I like you a lot) ja asteadverbeina (esim. a 
bit rude). Samoin kuin will-apuverbistä myös näistä konstruktioista on 
olemassa kontrahoidut muodot: varsinkin lotta on yleinen, mutta myös 
bitta-muotoa käytetään etenkin puheessa. Sama koskee myös monia 
muita englannin binominaalisia kvanttoreita, kuten sort of (sorta), kind 
of (kinda) ja type of (typa). 

Yksi tutkituimmista kieliopillistumisprosesseista on englannin be 
going to -konstruktion muuttuminen liikettä kuvaavasta rakenteesta fu- 
tuuria ilmaisevaksi konstruktioksi. Esimerkit 2 ja 3 kuvaavat rakenteen 
käyttöä varhaisuusenglannissa juuri ennen kieliopillistumisprosessin 
alkua, kun taas 4 ja 5 ovat esimerkkejä nykyenglannissa yleisestä, kieli- 
opillistuneesta futuurista. Esimerkki 5 on kiistaton todiste rakenteen 
kieliopillistumisesta: leksikaalinen go-verbi on lauseessa toistettu, koska 
be going to -rakenteessa olevaa going-sanaa ei enää käsitetä liikettä ilmai- 
sevaksi verbiksi. 


2. A yong mayd going to a feast with hir mother... (PPCEME%, 1582) 
3. Mistris Page, trust me, I was going to your house. (PPCEME, 1599) 
4. It's going to be tough for them. (COCA*s, 2012) 

5. I’m going to go to Nashville, Tennessee. (COCA, 2012) 


Esimerkit 2-5 ilmentävät be going to -konstruktion muutoksen alku- ja 
päätepisteitä, mutta rakenteen kieliopillistuminen tapahtui tosiasiassa 
vaiheittain vuosisatojen saatossa. Muutos sai alkunsa, kun kielenpuhu- 
jat alkoivat 1600-luvulla korostaa fyysiseen liikkeeseen tyypillisesti liit- 
tyvää tahdonalaisuutta ja aikomusta siinä määrin, että konstruktion ei 
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enää välttämättä tarvinnutkaan kuvata fyysistä liikettä. Esimerkeissä 6 ja 
7 on toki mahdollista, että puhuja liikkuu paikasta toiseen puhumaan, 
mutta todennäköisempää on, että hän ilmaisee ainoastaan aikomuksen- 
sa puhua. 


6. now, a certaine religious Woeman dyed at home with vs, about a day 
and a halfe, before that occurred, whereof i am going to speake (EEBO, 
1642) 

7. but there is another thing worth your observation, which i am going to 
tell you (EEBO, 1653) 


Leuvenin yliopiston tutkijat Sara Budts ja Peter Petré tarkastelivat vuon- 
na 2016 julkaistussa korpustutkimuksessaan be going to -konstruktion 
kieliopillistumista myöhäisuusenglannin kaudella (1700-1920). Myös 
he tulkitsivat be going to -rakenteen kieliopillistumisen subjektifikaatio- 
prosessiksi, jossa konstruktion alkuperäinen, liikettä kuvaava objektiivi- 
nen merkitys muuttui ensin subjektiivisemmaksi (puhujan omaa inten- 
tiota tarkoittavaksi) ja myöhemmin vielä subjektiivisemmaksi, niin että 
puhujat alkoivat käyttää konstruktiota ennakoidessaan yleisemmin tule- 
via tapahtumia ja asioita tai ollessaan epävarmoja tulevista tapahtumista. 
Budts ja Petré havaitsivat muun muassa, että ensimmäisen persoonan 
subjektipronominien osuus kaikista be going to -rakenteiden subjekteista 
pieneni tutkitun kauden kuluessa, kun taas toisen persoonan subjektien 
osuus kasvoi. Tämä selittyy muun muassa kysymyslauseiden yleistymi- 
sellä: toiselle ihmiselle esitetyt kysymykset, kuten are you going to come 
tomorrow?, ovat esimerkki rakenteen uudenlaisesta käytöstä, jossa pu- 
huja ei ilmaise omaa intentiotaan vaan osoittaa epävarmuutensa toisen 
henkilön aikomuksista. Budts ja Petré havaitsivat aineistossaan myös 
jyrkän laskun tulevan tapahtuman pikaisuudessa: vuosina 1710-1745 
peräti 79 % be going to -rakenteista viittasi puhetilannetta välittömästi 
seuraavaan tapahtumaan, kun taas 1886-1920 vastaava osuus oli enää 
29 %. Tilastollisena menetelmänä Budts ja Petré käyttivät Kendallin tau 
-testiä. 
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Tietolaatikko 2. 


e Budtsin ja Petrén käyttämät korpukset olivat Penn Parsed Corpus 
of Modern British English (Kroch, Santorini & Diertani 2016), 
ECCO-TCP Corpus” ja Corpus of Late Modern English Texts v.3.0 
(Diller, De Smet & Tyrkkö 2011). 

* Useamman kuin yhden korpuksen käyttäminen historiallisessa 
korpustutkimuksessa on varsin yleistä; yksittäinen korpus voi olla 
liian suppea tarkasteltavan kielen ilmiön kattavaan tutkimiseen. 

e Tutkijan on otettava tarkoin huomioon tutkimuksessaan käyttämiensä 
korpusten väliset erot. Koska suurin osa korpuksista on koottu eri 
periaatteita noudattaen, ei esimerkiksi sanojen frekvenssien vertailu 
korpusten välillä ole ongelmatonta. 


Budtsin ja Petrén tutkimus on monessa mielessä tyyppiesimerkki histo- 
riallisen korpuslingvistiikan menetelmin toteutettavasta tutkimuksesta: 
tutkijat pureutuvat tarkastelemaansa ilmiöön analysoimalla kattavasti 
sen eri käyttökonteksteja ja niissä tapahtuvia mikrotason muutoksia, 
minkä ansiosta he pystyvät tarjoamaan yksityiskohtaisen analyysin kieli- 
opillistumisprosessiin liittyvistä semanttisista tekijöistä. 


3.2.2. HISTORIALLINEN SOSIOLINGVISTIIKKA: -S JA -TH VERBIN 
KOLMANNEN PERSOONAN PÄÄTTEINÄ ENGLANNIN 
KIELESSÄ 


Historiallinen sosiolingvistiikka on kielitieteen suuntaus, joka sai alku- 
sysäyksensä sosiolingvististen hypoteesien testaamisesta historiallisissa 
aineistoissa. Näitä hypoteeseja olivat esimerkiksi naisten johtava rooli 
kielenmuutoksessa sekä ajatus siitä, että vertailemalla eri-ikäisten ih- 
misten kielenkäyttöä saadaan samalla tietoa kielenmuutoksesta ajas- 
sa: ihmisten kielenkäytön oletetaan suurelta osin vakiintuvan jo nuo- 
rena, joten vanhempien ihmisten kielenkäyttö edustaa varhaisempaa 
aikakautta kuin nuorempien (ns. näennäisaikahypoteesi). Suzanne 
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Romainen (1982) ohella historiallisen sosiolingvistiikan pioneereja ovat 
olleet Helsingin yliopiston tutkijat Terttu Nevalainen ja Helena Raumo- 
lin-Brunberg, joiden johdolla myös koottiin CEEC-korpus. 

Nevalainen ja Raumolin-Brunberg (2003) tutkivat useisiin eri 
kielellisiin muuttujiin eli variaabeleihin pohjautuvia muutoksia 
CEEC-korpuksessa aikavälillä 1410-1681 historiallisen sosiolingvis- 
tiikan näkökulmasta. Otamme tähän esimerkiksi kuvassa 3 esitellyn 
englannin yksikön kolmannen persoonan preesensin verbipäätteen 
variaabelin -s/-th. Nevalainen ja Raumolin-Brunberg huomauttavat, 
että kyseessä on oikeastaan kaksi eri muutosta: toisaalta painottoman 
/e/-vokaalin kato päätteestä, jonka alkuperäinen muoto oli siis -eth, ja 
toisaalta viimeisen konsonantin muuttuminen sibilantiksi. Nevalainen 
ja Raumolin-Brunberg osoittavat, että molemmat muutokset alkoivat 
Pohjois-Englannista. Ensimmäisenä alkoi -eth:n muuttuminen -es:ksi 
(esim. eateth vs. eates, joskin vokaalia saatettiin kirjoittaa esimerkiksi 
y:llä), mikä näkyy kuvassa 3 pienenä nousuna 1400-luvun lopulla; tämä 
ei kuitenkaan kunnolla levinnyt etelämmäksi. Noin sata vuotta myö- 
hemmin -s variantti aloitti uuden nousun, joka pohjautui -eth-muodon 
ja vokaalittoman -s-muodon väliseen vaihteluun (esim. eateth vs. eats); 
tuon ajan kirjoittajat pitivätkin -s-muotoa -eth-muodon lyhenteenä. Täl- 
lä kertaa muutos eteni useimmissa murteissa loppuun asti, ja nyky- 
englannin puhujat tuntevat -th-variantin lähinnä Shakespearen näytel- 
mistä ja Jaakko-kuninkaan aikaisesta raamatunkäännöksestä (1611), joka 
on edelleen käytössä joissakin kirkkokunnissa. 

Nevalainen ja Raumolin-Brunberg (2003) tarkastelivat muutosta usei- 
den sosiaalisten kategorioiden suhteen. Kirjoittajan asuinpaikan lisäksi 
variaabelin käyttöön — eli siihen, kumpaa varianttia kirjoittaja käytti enem- 
män — saattoivat vaikuttaa mm. hänen sukupuolensa, yhteiskunnallinen 
asemansa sekä suhteensa kirjeen vastaanottajaan. Menetelmänä Nevalai- 
nen ja Raumolin-Brunberg käyttivät variantin normalisoidun frekvenssin 
laskemista, kuten kuvassa 3, mutta he jakoivat aikakaudet sosiaalisten 
kategorioiden perusteella muodostettuihin alakorpuksiin. Sitten he ver- 
tailivat alakorpuksien normalisoituja frekvenssejä hypoteesitestauksen 
keinoin y?-testillä. Yllä mainitun alueellisen vaihtelun lisäksi he havait- 
sivat, että muutosta johtivat -s:n uuden nousun osalta odotetusti naiset. 
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Nopeita -s:n omaksujia olivat etenkin säätyläisiä alhaisemmassa yhteis- 
kunnallisessa asemassa olleet kirjoittajat sekä toisaalta sosiaaliset nousi- 
jat. Täydentääkseen tuloksiaan Nevalainen ja Raumolin-Brunberg toteut- 
tivat monimuuttuja-analyysin VARBRUL-ohjelmalla, jonka eri versioita 
on käytetty yleisesti sosiolingvistisessä tutkimuksessa.?* Monimuuttuja- 
analyysin avulla pystytään arvioimaan eri sosiaalisten kategorioiden suh- 
teellista tärkeyttä muutoksessa. Tässä analyysissa kirjoittajan asuinalue 
ja sukupuoli nousivat tärkeiksi muutosta selittäviksi tekijöiksi, kun taas 
kirjoittajan suhteella kirjeen vastaanottajaan (perheenjäsen/ystävä vs. 
muu) ei havaittu olevan merkittävää vaikutusta. 


4. Yhteenveto 


Historiallinen korpuslingvistiikka tarjoaa tutkijalle monipuolisen me- 
netelmän kielen varhaisempien vaiheiden ja kielenmuutoksen syste- 
maattiseen tarkasteluun. Korpuslingvistin työssä korostuu tutkimuksen 
lähteinä käytettyjen korpusten tarkka tunteminen, mutta kuten olemme 
pyrkineet tuomaan tässä artikkelissa esille, aineiston tunteminen on 
vain ennakkoedellytys tutkimuksen tekemiselle. Kieli voi muuttua mo- 
nesta syystä, ja historiallisen korpuslingvistin työkalupakkiin on hyvä 
kuulua esimerkiksi sosiolingvistiikan, pragmatiikan, kielikontaktien 
sekä kognitiivisen kielitieteen teorioiden hallinta. Yleisesti ottaen histo- 
rialliselle korpuslingvistiikalle leimaa-antavaa on määrällisten ja laadul- 
listen menetelmien yhdistäminen: tutkijan korpusaineistosta laskemien 
frekvenssien merkitsevyyttä voidaan esimerkiksi tarkastella tilastollisin 
menetelmin, ja niitä voidaan havainnollistaa monenlaisten visualisoin- 
tien avulla, mutta tulosten tulkinta nojaa aina laadullisen tutkimuksen 
periaatteisiin — numerot itsessään eivät ole vielä tutkimustulos. Toisaal- 
ta on hyvä pitää mielessä, että korkealaatuista korpuslingvistiikkaa on 
mahdollista tehdä myös ilman sofistikoituneita tilastollisia menetelmiä: 
kielenmuutokset voivat olla niin selkeitä, että niitä on mahdollista seu- 
rata pelkkien frekvenssitietojen avulla. 
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Tässä artikkelissa annetut esimerkit historiallisen korpuslingvistiikan 
kentästä on tarkoitettu ensikatsaukseksi metodologian eri soveltamis- 
mahdollisuuksiin. On selvää, että menetelmää käytetään laajalti myös 
muunlaisten tutkimuskysymysten tarkasteluun: esimerkiksi historial- 
lista semantiikkaa, pragmatiikkaa, fonologiaa ja kielen murrevaihtelua 
on kaikkia tutkittu monipuolisesti korpuslingvistiikan menetelmin. Di- 
gitaalisten ihmistieteiden yleistymisen myötä on todennäköistä, että niin 
korpuksia kuin muitakin digitaalisia kieliaineistoja on tulevaisuudessa 
tutkijan käytössä entistä enemmän ja nämä aineistot ovat yhä useam- 
min saatavilla myös muussa kuin tekstimuodossa. Esimerkiksi vanho- 
jen kirjeiden digitoidut kuvat voivat tarjota paljon sellaista tietoa teks- 
tistä ja sen tuottamiseen liittyvistä olosuhteista, joita pelkkä tietokoneen 
ruudulla näkyvä tekstirivi ei tavoita. Kuten CEEC-korpuksen esimerkki 
osoittaa, myös tekstien kirjoittajiin liittyviä taustatietoja on mahdollista 
kytkeä korpusaineistoon, jolloin ne ovat hyödyllisiä paitsi kielentutki- 
joille myös historioitsijoille. Muitakin tällaisia aineistoja on jo olemassa 
(esim. London Lives”), joskin ne on tyypillisesti koottu pääasiassa his- 
toriantutkimuksen tarpeisiin, eikä niiden käyttö sellaisenaan ole täysin 
ongelmatonta korpuslingvistiikan näkökulmasta. 

Tämän lyhyen katsauksen pyrkimyksenä on ollut tarjota joitakin näkö- 
kulmia historiallisen korpuslingvistiikan taustaan, perusolettamuksiin 
ja viimeaikaisiin kehityskulkuihin. Luvussa 3 esitetyt tapaustutkimukset 
ovat esimerkkejä yksittäisiin kysymyksiin pureutuvasta tutkimuksesta, 
jotka osana suurempaa kokonaisuutta voivat tarjota uutta tietoa esimer- 
kiksi sellaisista perustavanlaatuisista kysymyksistä, joita nostimme esiin 
artikkelimme johdannossa. Toivomme, että tämä artikkeli välittää luki- 
jalle kuvan korpuslingvistiikasta monipuolisena menetelmänä, joka ke- 
hittyy niin kielitieteen tutkimusalan kuin yleisen tietoteknisen kehityk- 
sen rinnalla ja jonka avulla voimme saada jatkuvasti uutta tietoa paitsi 
kielestä järjestelmänä myös ihmisyhteisöjen kielikäytäntöjen vaihtelusta 
ja muutoksesta. 
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Mikä? 


Kielikontaktien tutkimus tarkastelee kahden tai useamman kielimuodon 
kohtaamiseen liittyviä ilmiöitä. Usein tutkimuskohteena on kielikontaktin 
aikaansaama kielenmuutos, mutta huomio voi olla myös esimerkiksi 
monikielisiin tilanteisiin liittyvissä ilmiöissä ja käytänteissä. Kielikontak- 
ti voi vaikuttaa kaikkiin kielen tasoihin, ja siksi tutkimuksessa käytetyt 
menetelmät ovat usein samoja kuin muilla kielitieteen aloilla. Kontak- 
ti-ilmiöiden ymmärtäminen ja kontaktilähtöisen kielenmuutoksen osoit- 
taminen vaativat tyypillisesti useiden eri menetelmien soveltamista. 


Katso myös: 

Luku 14 Kielitypologian menetelmät 

Luku 15 Historiallinen ja vertaileva kielentutkimus 
Luku 16 Antropologinen lingvistiikka 


Luku 21 Sosiolingvistiikka 
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1. Johdanto 


Kielikontakti tarkoittaa laajimmillaan mitä tahansa tilannetta, jossa on 
tavalla tai toisella läsnä enemmän kuin yksi kielimuoto, olivatpa sitten 
kyseessä puhutut, viitotut tai kirjoitetut kielet. Useimmiten kielikontak- 
tien tutkimuksen kiinnostuksen kohteena ovat ainakin jossain määrin 
toistuvat monikieliset tilanteet ja tällaisten tilanteiden kielelliset seu- 
raukset eli kontaktilähtöinen kielen muutos. 

Kielikontaktin laajimman määritelmän kannalta on vaikea sanoa, 
mihin kielentutkimuksen alaan kielikontaktit eivät millään tavalla 
liittyisi. Vaikka ajateltaisiin yksikielistä puhujaa, joka on tekemisis- 
sä vain samaa kieltä puhuvien ihmisten kanssa, hän altistuu mah- 
dollisesti myös toisille murteille. Hän käyttää todennäköisesti myös 
lainasanoja, vaikka kyseinen yhteisö ei kyseisellä hetkellä olisikaan 
tekemisissä muiden kielten puhujien kanssa. Lisäksi puhujan kieli 
muistuttaa todennäköisesti rakenteeltaan muita samalla alueella pu- 
huttuja kieliä, vaikka ne eivät olisikaan sille sukua. Lainasanasto ja 
tietyille maantieteellisille alueille tyypilliset, kielikuntarajat ylittävät 
rakennepiirteet kertovat historiallisista kontakteista. Turvallisinta on- 
kin olettaa, että jokainen kieli on historiansa aikana ollut alttiina kieli- 
kontakteille ja että kielen kulloinenkin asu on aina jossain määrin 
kontaktien muovaama. 

Kielikontaktien ja niiden seurausten esiintyminen lähes kaikkialla ei 
merkitse kuitenkaan sitä, että niiden rooli olisi helppo osoittaa esimer- 
kiksi kielen muutosta selitettäessä. Kontaktilähtöisiä selityksiä on lisäksi 
vieroksuttu aiemmassa historiallisessa kielentutkimuksessa: kontakti- 
selitys on kelvannut usein vain siinä tapauksessa, että muutosta ei ole 
voitu selittää kielensisäisillä tekijöillä. Synkroniselle kielentutkimukselle 
voi lisäksi olla melko yhdentekevää jonkin piirteen tai sanan alkuperä, 
eritoten mikäli ilmiön kontaktilähtöisyys ei ole puhujien yleisessä tie- 
dossa. Tosin mikäli jonkin piirteen alkuperä kuitenkin on tiedossa esi- 
merkiksi siitä syystä, että puhujat tunnistavat sen selkeästi lainatuksi 
jostakin tietystä kielestä, arkiajattelussa tällaiseen piirteeseen voi liittyä 
esimerkiksi kielteisiä asenteita. Myös kielen normittamiseen on lähes 
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aina liittynyt puristisia pyrkimyksiä, joiden tarkoitus on nimenomaisesti 
puhdistaa vieraaksi katsottu aines. 

Kielikontakteja tutkitaan monella kielitieteen alalla. Karkeasti 
lähestymistapoja voi rajata sen mukaan, keskittyykö tutkimus synkroni- 
sesti havainnoitaviin ilmiöihin vai aiemmin tapahtuneiden kontaktien 
jättämiin jälkiin kielissä. Lisäksi kielikontaktien roolin arviointi on useim- 
miten olennainen osa niin historiallista kielentutkimusta kuin kieli- 
typologiaa (ks. Historiallinen ja vertaileva kielentutkimus; Kielitypologian 
menetelmät tässä kirjassa). Lähestymistapojen moninaisuudesta johtuen 


kielikontaktien tutkimuksessa käytettyjä metodeja onkin lukuisia, ja vain 
osa niistä on käytössä yksinomaan kontaktien tutkimuksen piirissä. Tämä 
käy ilmi esimerkiksi merkittävimmän laaja-alaisen kielikontaktien tutki- 
muksen aikakausjulkaisun Journal of Language Contact artikkelikirjosta. 

Seuraavassa luvussa esitellään kielikontaktien tutkimuksen histo- 
riaa. Kielikontaktitutkimuksen monialaisuuden vuoksi menetelmiä ja 
niiden valintaa lähestytään tutkittavien ilmiöiden ja alan teoreettisten 
peruskysymysten kautta. Kolmannessa luvussa käsitellään kielikontak- 
teja kielenmuutoksen selittäjänä (3.1.), kontaktitilanteiden tutkimusta 
(3.2.), kontaktin historian arviointia sen tuloksen kautta (3.3.), areaali- 
lingvistiikkaa eli kontaktialueiden tutkimusta (3.4.), kontaktin synnyttä- 
miä uusia kielimuotoja (3.5.) ja kontaktien tutkimuksen sekä typologian 
suhdetta (3.6.). Lopuksi esitetään kootusti, mitä menetelmällisiä val- 
miuksia kielikontaktien tutkijalta vaaditaan. 


2. Kielikontaktien tutkimuksen historia ja sen 
asema historiallisessa kielentutkimuksessa 


Kielikontaktien tutkimuksen historia ulottuu paljon kauemmaksi 
menneisyyteen kuin itse käsite. Esimerkiksi sanaston lainautuminen 
tunnettiin ilmiönä jo antiikissa, vaikka etymologinen tutkimus ym- 
märrettiin pitkään varsin toisella tapaa kuin nykyään: etymologiassa 
oli kyse sanojen merkityksen ja alkuperän selittämisestä usein varsin 
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vaikutelmanomaisesti, ja vasta 1800-luvulla lainasanoista tuli systemaat- 
tisen tutkimuksen kohde. Lainasanatutkimusta voidaankin pitää ensim- 
mäiseksi vakiintuneena kielikontaktien tutkimuksen suuntauksena. 
Lainasanatutkimuksen kehitys on tiiviisti yhteydessä nuorgrammaat- 
tisen historiallis-vertailevan kielitieteen syntyyn 1800-luvulla. Säännöl- 
listen äännevastaavuuksien löytyminen sukukielten välillä mahdollisti 
niin kielten sukulaissuhteiden toteamisen kuin kantakielten rekonstruk- 
tion. Samankaltainen säännöllinen vastaavuus äänteiden välillä havait- 
tiin myös lainasanastossa: tietystä kielestä tiettyyn aikaan lainautuneiden 
sanojen äänteistö korvataan lainansaajakielessä aina tietyillä äänteillä. 
Toisaalta lainasanat on pystyttävä erottamaan niistä sanoista, jotka osoit- 
tavat kielisukulaisuutta. Lainasanatutkimus ja historiallinen kielentutki- 
mus muotoutuivat pian symbioottisiksi: niin äänteistön rekonstruktion 
kuin kielen muutoksen suhteellisen ja absoluuttisen ajoituksen osalta 
lainasanojen tuntemuksella on keskeinen merkitys (ks. Historiallinen ja 


vertaileva kielentutkimus tk.). 
Historiallis-vertailevan kielentutkimuksen saavutukset, kuten uusien 


kielikuntien löytyminen ja kielten välisten suhteiden mallintaminen 
sukupuuna, toivat mukanaan myös havaintoja, joiden selittämiseen 
äännevastaavuuksiin perustuva metodiikka ei pystynyt. Eräs näistä ha- 
vainnoista liittyi kolonialismin synnyttämiin kielitilanteisiin. Joidenkin, 
usein afrikkalaisten tai afrikkalaistaustaisten yhteisöjen kieleksi oli muo- 
dostunut sanastoltaan eurooppalaisten kolonisoijien kieliin pohjautuva 
mutta kieliopiltaan uudelleenjärjestynyt kreoli, joka oli usein syntynyt 
usean kielen kontaktitilanteessa. 1800-luvun loppupuolelle asti kieli- 
tieteilijöiden suhtautuminen kreoleihin heijasteli tuon ajan rasistista ja 
etnosentristä ihmiskäsitystä: kreolit erosivat leksifioijakielistään esimer- 
kiksi vähäisemmällä sanataivutuksellaan, mikä tulkittiin muun muassa 
kreolien puhujien älylliseksi kykenemättömyydeksi omaksua kehitty- 
neempinä pidettyjen eurooppalaiskielten kielioppia (ks. myös luku 3.6.). 

Kontaktikieliksi kutsuttujen kielimuotojen, kuten juuri kreolien 
mutta myös pidginien ja sekakielten (sa. Mischsprache, engl. mixed 
language), tutkimuksen uranuurtajana voidaan pitää saksalaista Hugo 
Schuchardtia (1842-1927; ks. Meijer & Muysken 1977; kontaktikielis- 
tä ks. luku 3.5.). Schuchardt tunnetaan myös nuorgrammaatikkojen 
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sukupuumallille vaihtoehtoisen aaltomallin kehittäjänä. Vaikka aalto- 
malli kunnianhimoisimmassa muodossaan unohtuikin, Schuchardtin 
nuorgrammaatikkoihin kohdistamaan kritiikkiin liittyi elementtejä, jot- 
ka 1900-luvun lopulla saivat laajan hyväksynnän. Parhaiten näistä tun- 
netaan Schuchardtin ajalleen vastavirtainen näkemys, että kaikki kielet 
ovat enemmän tai vähemmän ”sekakieliä”, toisin sanoen on oletettava, 
että jokainen kieli on ollut jonakin aikana alttiina kielikontaktille (ks. 
esim. Nicolai 2014, 228-232). 

Vuosikymmentä myöhemmin puolalaissyntyinen Jan Baudouin de 
Courtenay (1845-1929) pohti, Schuchardtin hengessä, kaikkien kielten 
kontaktiluonnetta (Boduen-de-Kurtené 1901). Hänen tarkastelukulman- 
sa ei liittynyt kuitenkaan historialtaan läpinäkyviin kontaktikieliin, kuten 
kreoleihin, vaan ilmiöihin, joita nykyään kutsutaan areaalilingvistisiksi. 
Kielitieteellisen kiinnostuksen kohdistuessa yhä useampaan kieleen ja 
kielikuntaan havaittiin, että joillakin alueilla puhutut kielet muistutti- 
vat toisiaan merkittävästi, vaikka ne eivät olleet lähisukukieliä tai sukua 
ollenkaan. De Courtenayn yhtenä kiinnostuksen kohteena olleiden Bal- 
kanin kielten (kreikan, albanian, eteläslaavilaisten ja Balkanin romaa- 
nisten kielten) osalta tällaisia havaintoja esitettiin jo 1800-luvun alussa 
(Kopitar 1829). Pohjois-Amerikassa vastaavia havaintoja kielipiirteiden 
leviämisestä teki Franz Boas (1858-1942; ks. esim. 1911, 47—53) mante- 
reen luoteisosan alkuperäiskielissä. 

Tällaisten toisiaan muistuttavien naapurikielten ryhmien nimi- 
tykseksi vakiintui kieliliitto (sa. Sprachbund < ven. jazykovoj sojuz) 
Nikolai Trubetzkoyn (1890-1938; Trubetzkoy 1928, 18) ensimmäisessä 
kansainvälisessä lingvistikongressissa esittelemän ehdotuksen myötä. 
Trubetzkoyn ehdotuksessa kieliliitto ja kielikunta (sa. Sprachfamilie) olivat 
kieliryhmän (sa. Sprachgruppe) alakäsitteitä. Siinä missä kielikunta mää- 
rittyy kielisukulaisuuden kautta, tällaista yhteyttä ei kieliliiton kielillä 
ole. Määritelmässä kieliliiton kielet muistuttavat toisiaan suuressa mää- 
rin syntaksiltaan ja morfologiselta rakenteeltaan. Niissä on merkittävä 
määrä yhteisiä kulttuurisanoja ja mahdollisesti myös pinnallisia ään- 
teellisiä samankaltaisuuksia, erona kielikunnissa esiintyviin yhteiseen 
perussanastoon ja säännöllisiin äännevastaavuuksiin. Usein on esitetty 
näkemyksiä, joiden mukaan Trubetzkoyn määritelmän taustalla olisi 
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ollut lähinnä Balkan parhaiten tuolloin tunnettuna kieliliittona. Kuiten- 
kin esitellessään käsitteen ensimmäistä kertaa Trubetzkoy (1923) mai- 
nitsee Balkanin ainoastaan alaviitteessä keskittyen hahmottelemiinsa 
uralilais-altailaiseen ja Välimeren kieliliittoihin, joita nykyään pidettäi- 
siin kokonsa vuoksi pikemmin makroalueina. 


Eurooppa kontaktialueena 


Euroopassa puhuttavat indoeurooppalaiset kielet olivat pitkään se 
normi, johon muun maailman ”eksoottisia” kieliä eksplisiittisesti tai 
implisiittisesti verrattiin. Tilanne oli nurinkurinen, sillä Euroopan kielet 
edustavat vain noin 1-2 prosenttia maailman kielistä — kahden prosentin 
suuruusluokkaan pääsemiseksi on otettava mukaan myös Kaukasian 
kielet. Kielitypologisen tutkimuksen myötä on noussut esiin se käsitys, 
että Euroopan kielet ovatkin varsin epätavallisia koko maailman mitta- 
kaavassa ja että Eurooppa, varsinkin Länsi- ja Keski-Eurooppa, on tiivis 
kielellinen alue, jossa kielet ovat lainanneet toisiltaan piirteitä kontaktien 
kautta. Jotkut tutkijat puhuvat jopa Euroopan kieliliitosta samaan tapaan 
kuin Balkanin kieliliitosta. 


Euroopan Tiedesäätiö rahoitti vuosina 1990—1994 laajaa EUROTYP- 
projektia. Sen tulokset julkaistiin kahdeksassa paksussa niteessä, jois- 
sa Euroopan kieliä on kuvattu typologisesti monesta eri näkökulmasta. 
EUROTYP-projektiin keskeisesti osallistunut Martin Haspelmath esitti 
teesin Euroopasta kielellisenä alueena tai jopa kieliliittona, jolle hän an- 
toi nimen SAE eli Standard Average European (Haspelmath 1998; 2001; 
SAE oli alun perin Benjamin Lee Whorfin 1930-luvulla kehittämä termi, 
jolla hän kuvasi eurooppalaisten kielten välittämän käsiterakenteen sa- 
mankaltaisuutta, ks. esim. Whorf 2012, 178). Euroopan kielten yhteisiä 
piirteitä ovat käsitelleet myös Heine ja Kuteva (2006). 


Haspelmathin esittämiä piirteitä ovat esimerkiksi määräinen ja epä- 
määräinen artikkeli, relatiivipronominilla muodostettava relatiivilause, 
'omistaa'-apuverbià käyttävä perfektitempus ja partisiippien avulla muo- 
dostettava passiivilause. Millä metodeilla tällaisten piirteiden leviämistä 
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kielikontaktien kautta voidaan tarkastella ja perustella? Tässä voidaan 

erottaa kolme vaihetta: 

1. Ensin on osoitettava, että näitten piirteitten esiintyminen alueen kie- 
lissä on suurempi kuin pelkän sattuman kautta voitaisiin odottaa. 
Tähän on nykyään hyvänä apuna verkossa konsultoitavissa oleva The 
World Atlas of Language Structures (WALS): vaikka siitä aina väliin 
paljastuu virheitä yksittäisten kielten kuvauksissa ja isompien kielten 
osalta kuvaukset perustuvat kirjakieliin, se antaa kuitenkin hyvän ku- 
van siitä, mikä on yleistä, mikä harvinaista ja millainen maantieteelli- 
nen jakauma eri piirteillä on. Euroopan kielistä löytyy tosiaan monia 
yleisiä rakennepiirteitä, jotka erottavat ne kartalla selvästi naapuri- 
alueista (Keski-Aasiasta, Lähi-idästä ja Pohjois-Afrikasta) tai jopa koko 
maailmasta, joten ei ole järkevää olettaa, että jokainen Euroopan kieli 
olisi kehittänyt ne toisista riippumatta. 

2. Sen jälkeen on osoitettava, etteivät yhteiset piirteet ole kielisukulai- 
suuden aiheuttamia. Tämähän voisi hyvinkin olla mahdollista, koska 
suurin osa Euroopan kielistä kuuluu indoeurooppalaiseen kielikun- 
taan ja Haspelmathin piirteet ovat keskittyneet niihin, vieläpä nimen- 
omaan romaanisiin ja germaanisiin kieliin; slaavilaisissa kielissä ja 
esimerkiksi uralilaisissa kielissä unkarissa ja suomessa piirteitä on 
vähemmän. Kielihistoriallinen tieto osoittaa kuitenkin, ettei näitä piir- 
teitä ollut indoeurooppalaisessa kantakielessä (tai missään Euroopan 
indoeurooppalaisten kielten myöhemmässä yhteisessä kantakieles- 
sä) ja että useat niistä kehittyivät ja levisivät vasta ajanlaskumme en- 
simmäisellä vuosituhannella, kun indoeurooppalaiset kielet olivat jo 
lähteneet kukin omalle kehitystielleen. SAE-piirteiden keskittyminen 
Eurooppaan ei siis johdu kielisukulaisuudesta. (Sukukieltenkin yhtei- 
nen piirre voi siis olla kontaktilähtöinen, jos sitä ei esiintynyt niiden 
yhteisessä kantakielessä.) 

3. Vaiheet 1-2 riittävät osoittamaan piirteet kontaktilähtöisiksi, mutta 
hypoteesi saa vielä lisävahvistusta, jos piirteitten lainautumisen me- 
kanismia ja sen sosiaalista kontekstia voidaan kuvata tarkemmin. 
Haspelmath esittää useitten (vaikkei kaikkien) SAE-piirteiden levin- 
neen kielestä toiseen vanhan ajan ja keskiajan taitteessa kansain- 
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vaellusaikana, jolloin Euroopan väestölliset ja valtiolliset olosuhteet 
muuttuivat radikaalisti. Euroopan kontaktialueen ydintä eli SAE-piir- 
teiden keskittymää Länsi- ja Keski-Euroopassa kutsutaankin joskus 
”Kaarle Suuren kieliliitoksi” (engl. Charlemagne sprachbund, van der 
Auwera 1998, 824). 


Samanaikaisesti kun havaintoja kontakti-ilmiöistä alettiin esitellä, nou- 
si esiin kysymys kontaktilähtöisen kielenmuutoksen mekanismeista. 
Italialainen Graziadio Isaia Ascoli (1829-1907) kehitteli 1800-luvun 
loppupuoliskolla niin kutsutun substraattiteorian, jonka mukaan mur- 
teiden eriytymisen taustalla on usein kielenvaihto (ks. esim. Pellegrini 
1980, 45). Substraatti on osa Ascolin luomaa käsitteistöä kielikontak- 
tin sosiolingvistisille asetelmille: Substraatti on syrjäytynyt kieli, jonka 
vaikutus on nähtävissä sen syrjäyttäneessä kielessä, ja tyypillisesti sub- 
straatti havaitaan äänteistössä ja paikannimistössä. Adstraatilla puoles- 
taan tarkoitetaan kieltä, joka on vaikuttanut toiseen kieleen kumman- 
kaan syrjäytymättä. Usein oletetaan myös, että adstraattisuhteessa olevat 
kielet ovat prestiisiltään eli arvostukseltaan samankaltaista. Superstraat- 
ti on sosiaalisesti hallitseva kieli, joka vaikuttaa sosiaalisesti alempaan 
kieleen; jotkut käyttävät termiä tilanteessa, jossa superstraatti syrjäyttää 
substraatin, jotkut taas tilanteessa, jossa superstraatti itse lopulta katoaa 
toisen kielen tieltä sosiaalisesti korkeammasta asemastaan huolimatta. 
Superstraattina voi toimia esimerkiksi lingua franca, eri kielten puhu- 
jien keskinäisessä kommunikaatiossa käyttämä yleiskieli kuten englanti 
nykyään suuressa osassa maailmaa. Toinen italialainen kielitieteilijä, 
Matteo Bartoli (1873-1946), puolestaan kehitti malleja kielellisten in- 
novaatioiden leviämisestä maantieteellisesti ja prestiisin merkityksestä 
näiden omaksumisessa (Hall 1946). 

Kielikontaktien mekanismien tutkimus monipuolistui 1900-luvun 
loppua kohti. Italialaisten kollegoidensa tavoin nykyaikaisen kielitieteen 
yksi uranuurtaja, Leonard Bloomfield (1887-1949), pyrki tarkastelemaan 
kontaktilähtöisen kielenmuutoksen vuorovaikutuksellisia ulottuvuuksia 
niin eri kielten kuin kielen varieteettien välillä (ks. esim. Bloomfield 
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1933, 445—495). Sosiolingvistiikan nousu toi mukanaan tarkempia mal- 
leja kieliyhteisöiden tarkasteluun, ja kielikontaktitutkimuksen klassi- 
kossa, Uriel Weinreichin (1926-1967) teoksessa Languages in Contact 
(1970 [1953]), keskeisellä sijalla ovat havainnot toisen kielen oppimisesta 
ja monikielisyydestä. 1900-luvun lopulle tultaessa asemansa olivat va- 
kiinnuttaneet myös sellaiset lähtökohdiltaan synkronista kielikontaktien 
tutkimusta edustavat alat kuin koodinvaihdon tutkimus ja sosiolingvis- 
tinen monikielisyyden tutkimus (ks. luku 3.2.). 


3. Miten kielikontakteja tutkitaan 


Kielikontaktien tutkimuksessa käytetyt menetelmät riippuvat siitä, mil- 
laisia kontakti-ilmiöitä havainnoidaan ja mitä kontaktilähtöisen muu- 
toksen osa-aluetta on tarpeen kuvata ja selittää. Tämä luku esittelee 
kontaktitutkimuksen metodologiaa ilmiöiden ja niiden selittämisen 
lähtökohdista. 


3.1. Millaiset muutokset voivat olla kontaktilähtöisiä 


Kielitieteessä oli pitkään vallalla käsitys, jonka mukaan kieli voi omak- 
sua toisesta vain sellaisia piirteitä, jotka jollakin tapaa sopivat sen ra- 
kenteeseen ja omiin kehitystendensseihin; tällaisia käsityksiä ovat esit- 
täneet esimerkiksi Antoine Meillet, Edward Sapir ja Roman Jakobson 
(Thomason 2001, 63). Näyttää kuitenkin siltä, että mille tahansa tällai- 
selle strukturaaliselle rajoitukselle löytyy vastaesimerkkejä, jos kontakti- 
tilanne on sosiolingvistisesti tarpeeksi kontaktia suosiva. Tämän osoittivat 
erityisesti Sarah Thomason ja Terrence Kaufman (1988, 13—34) paljon 
siteeratussa kielikontakteja käsittelevässä monografiassaan (vrt. myös 
Thomason 2001, 63-66). 

Tästä huolimatta on totta, että rakenteeltaan samankaltaiset kie- 
let lainaavat toisiltaan piirteitä kielen eri tasoilla helpommin kuin 
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typologisesti kovin erilaiset. Sen lisäksi kielen tietyillä osa-alueilla kon- 
taktivaikutus on todennäköisempää kuin toisilla. Kontaktivaikutukselle 
herkintä on sanasto mutta myös fonologia. Niinpä esimerkiksi suomi 
on lainannut runsaasti sanoja ruotsista. Suomenruotsi on puolestaan 
lainannut suomesta enemmän sanoja kuin ruotsinruotsalaiset murteet, 
ja se on myös lähestynyt suomea ääntämiseltään — siinä ei esimerkiksi 
esiinny juurikaan tooniaksenttia eikä klusiilien aspiraatiota (Kuronen & 
Leinonen 2001). Seuraavaksi herkimmin kieli ottaa vaikutteita toisista 
kielistä syntaksissa. Esimerkki aivan tuoreesta syntaktisesta lainavaiku- 
tuksesta englannista suomeen on konjunktion koska käyttö ilman pre- 
dikaattiverbiä, kausaalisen preposition tapaan, esim. en tehnyt läksyjä 
koska harkat. Vastaava englannin because-sanan käyttö valittiin American 
Dialect Societyn ”vuoden sanaksi” 2013 (Steinmetz 2014), joten piirre on 
lainattu suomeen aivan tuoreeltaan. 

Vaikeammin tutkittavia mutta ilmeisesti varsin helposti tapahtuvia 
ovat kontaktilähtöiset muutokset semantiikassa, varsinkin yksittäisten 
sanojen merkityksessä, erityisesti jos puhujat pitävät kahden eri kielen 
sanoja samoina. Niinpä suomen kontrolli on perinteisen merkityksensä 
"valvonta, tarkistus’ lisäksi saanut englannin vaikutuksesta myös merki- 
tyksen "hallinta, ohjaus’ (menetin pyörän kontrollin alamäessä), ja tieteen 
ja tekniikan kehityksen asemesta puhumme yhä useammin tieteen ja tek- 
nologian kehityksestä, koska englannin technique "taituruus; menetelmä" 
on merkitykseltään suppeampi kuin suomen tekniikka. 

Vaikeimmin lainautuu sidonnainen morfologia eli erilaiset affiksit. 
Johtimet lainautuvat kuitenkin helpommin kuin kieliopilliset affiksit; 
esimerkiksi ruotsista suomeen lainatun -(U)ri-johtimen (nahkuri, kan- 
kuri, suursyömäri) alkuperä on viime kädessä latinassa (-drius), josta se 
on levinnyt moniin eurooppalaisiin kieliin. Taivutusmorfologiassa on ta- 
vallisempaa, että jokin morfologinen kategoria lainautuu kuin että myös 
sen merkitsin lainautuu. Balkanin kieliliiton kielissä (ks. luku 3.4.) on 
paljon samankaltaisia morfosyntaktisia kategorioita mutta lainautuneita 
kieliopillisia morfeemeja on vain vähän. Esimerkkejä tällaisistakin kyllä 
löytyy: romania on lisännyt maskuliinin vokatiivin eli puhuttelusijan 
(joka esiintyi jo latinassa) rinnalle feminiinin vokatiivin, jonka pääte -o 
(esim. soro ’sisko!’) on laina slaavilaisista kielistä (Feuillet 2012, 182). 
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Kreikan Traakiassa puhuttava romanikieli on lainannut turkista paitsi 
epäsuoran evidentiaalin (tiedon lähdettä ilmaisevan kieliopillisen muo- 
don) myös sen merkitsimen -mis allomorfisessa asussa mus; romani- 
kielessä se ei kuitenkaan ole sidonnainen vaan vapaa morfeemi ('kuu- 
lemma’, ’muka’, Adamou 2012, 24-25), joten sekään ei ole täydellinen 
esimerkki taivutusmorfeemin lainautumisesta. (Vrt. myös itäslaavista 
suomeen lainattuun johtomorfeemiin -nik > -niekka, joka suomessa on 
pikemminkin yhdyssadan jälkiosa kuin johdin, sillä se ei mukaudu vo- 
kaalisointuun, esim. taitoniekka, kynäniekka.) 

Silloin kun kieliopillisen kategorian ilmaisu on analyyttinen eli peri- 
frastinen (esimerkiksi syntaktisten suhteiden ilmaiseminen preposi- 
tioilla tai aikamuotojen ilmaiseminen apuverbillä), sen lainautuminen 
muistuttaa syntaktista lainautumista. Euroopan kielissä, varsinkin pitkin 
maanosan rannikkoalueita, esiintyy perifrastisia perfektitempuksia, joi- 
den merkitys on varsin samankaltainen ja jotka muodostetaan partisii- 
pista, johon liittyy apuverbi 'olla' (kuten suomessa) tai ‘omistaa’ (kuten 
ruotsissa; ks. Lindstedt 2000). Itse apuverbin äänneasu ei ole kielestä 
toiseen sama mutta perfektin muodostustapa on. 

Tutkittaessa kielikontaktin vaikutuksia historiallisessa kielitieteessä 
keskeinen metodologinen kysymys on todistustaakka: vaativatko kon- 
taktilähtöiset muutokset vai kielensisäiset muutokset erityistä todiste- 
lua, jos kumpikin selitys olisi periaatteessa mahdollinen. Perinteisesti 
kielentutkimuksessa on suosittu kielensisäisiä muutoksia nollahypotee- 
sina, jota ei tarvitse erikseen todistaa, mutta sanojen lainautumista on 
sentään pidetty normaalina. Sellaisten sanaparien kuin ruotsin gata ja 
suomen katu, tai ruotsin pojke ja suomen poika, kohdalla lainautuminen 
on itsestään selvää, varsinkin kun ruotsin ja suomen välillä on paljon 
tällaisia sanapareja. Silloinkaan lähdekieli ja lainautumisen suunta ei 
ole aina itsestään selvä: suomen katu on lainaa ruotsista (mikä onkin 
ollut vallitseva lainaussuunta), mutta ruotsin pojke puolestaan on lainaa 
suomesta (ja sen samankaltaisuus englannin boy-sanan kanssa on siis 
pelkkää sattumaa). 

Nykyään kieliopillisten piirteitten lainautumiseen sinänsä ei enää 
suhtauduta epäilevästi, mutta yleisesti voi sanoa, että mitä vaikeammin 
lainautuvista piirteistä on kysymys, sitä paremmin pitää yrittää kuvata 
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sitä sosiaalista tilannetta, jossa lainautuminen tai muu kontaktivaikutus 
on voinut tapahtua. Lainasanojen osalta riittää, että kielten kontakti on 
ylipäätään ollut mahdollinen — lainasanojen laatu voi sitten itsestään 
kertoa meille enemmän kontaktin luonteesta (ks. luku 3.3.). Sen sijaan 
esimerkiksi perfektitempuksen lainautumisen olettaminen edellyttää 
enemmän tietoa kontaktitilanteen laajuudesta ja pituudesta, kaksikielis- 
ten puhujien olemassaolosta ja kirjallisten traditioiden roolista yhteis- 
kunnassa, varsinkin kun perifrastinen perfekti voi toki aina syntyä myös 
kielen sisäisten muutosten seurauksena. 

Jos sama piirre esiintyy useammassa kuin kahdessa naapurikieles- 
sä, kontaktilähtöisyyden todennäköisyys kasvaa voimakkaasti, vaik- 
kei piirteen lähdekieltä aina voisi osoittaa (vrt. luku 3.4. kieliliitoista). 
Euraasiassa on Balkanilta pitkälle Aasiaan ulottuva alue, jonka kielissä 
esiintyy tiedon lähdettä ilmaiseva evidentiaalisuuskategoria (Haarmann 
1970; de Haan 2013). Alueen länsipään kieliin bulgariaan, makedoniaan 
ja albaniaan kategoria on selvästikin tullut turkista. Jonkinlaisista kie- 
li-isänmaallisista syistä esimerkiksi osa bulgarialaisista lingvisteistä on 
halunnut pitää kielensä evidentiaalisuutta sisäsyntyisenä viitaten siihen, 
että evidentiaalisuus on kehittynyt myös moneen sellaiseen maailman 
kieleen, joka ei ole ollut missään yhteydessä turkkiin. Yksittäisen kielen 
kohdalla onkin aina mahdollista, että se on kehittänyt evidentiaalisuu- 
den sisäisistä syistä, mutta on hyvin epätodennäköistä, että tällaiset kie- 
let täysin sattumalta olisivat naapurikieliä, jotka muodostavat yhtenäisen 
alueen. Siksi kontaktiselitys on tässä tapauksessa uskottavampi. 


3.2. Kontaktitilanteiden synkroninen tutkimus 


Joskus kielikontakti-ilmiön asetelma tunnetaan hyvin ja siihen vaikutta- 
via tekijöitä voidaan havainnoida nykyhetkessä. Tällainen synkroninen 
kielikontaktien — tai usein pikemmin monikielisten käytänteiden — tut- 
kimus on tyypillisesti kiinnostunut kontakti-ilmiöiden sekä erilaisten 
monikielisten tilanteiden analyysista sekä näistä tilanteista sosiaalisina 
ja yhteiskunnallisina ilmiöinä. Tällaisia tutkimusaloja ovat muun muas- 
sa akkommodaation ja koodinvaihdon (engl. code switching) tutkimus, 
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monikielisyystutkimus sekä kielenvaihdon (sa. Sprachwechsel, engl. 
language shift) tutkimus. Huolimatta eriytyneestä ja usein soveltavam- 
masta tutkimusperinteestään toisen kielen oppimisen tutkimus tarkas- 
telee niin ikään monen muun kielikontakti-ilmiön kannalta keskeisiä 
prosesseja. 

Kaikkien edellä mainittujen tutkimusalojen piirissä on mahdollista 
tarkastella kohteena olevia ilmiöitä myös menneisyydessä, esimerkiksi 
toisen kielen oppimisen tutkimuksessa voidaan käyttää pitkittäisaineis- 
toja kielitaidon karttumista mitattaessa. Diakronisesta kontaktitutki- 
muksesta nämä lähestymistavat kuitenkin tyypillisesti eroavat selittävien 
ja selitettävien tekijöiden osalta. Siinä missä esimerkiksi lainasanan eri 
murremuodot ja levikki tai toisesta kielestä lainatun rakenteen kieliopil- 
linen rooli tunnetaan hyvin, lainautumiseen johtanut sosiolingvistinen 
asetelma ja muut tekijät ovat usein hämärän peitossa. Synkronisessa 
tutkimuksessa tarkastelun keskiössä ovat monikieliset käytänteet, ja 
tutkimusaineistoa on mahdollista kartuttaa haastatteluin ja jopa kokeel- 
lisesti, jolloin itse kontakti-ilmiöön vaikuttavia taustatekijöitä voidaan 
suoraan säädellä. Usein on kuitenkin kiistanalaista tai epäselvää, missä 
määrin havaitut synkroniset ilmiöt vaikuttavat kielenmuutokseen pi- 
demmällä tähtäimellä. 

Akkommodaatio tarkoittaa sitä, että puhujat modifioivat ilmaisuaan 
keskustelukumppanista riippuen. Koska akkommodaatiotutkimus tyy- 
pillisesti tarkastelee kahden puhujan vuorovaikutusta, on sen tutkimuk- 
sessa mahdollista soveltaa muun muassa kokeellisia menetelmiä (ks. 
Kokeellinen fonetiikka tk.). Tarkasteltavien selittävien tekijöiden osal- 


ta tutkimusasetelmat ovat usein samanlaisia kuin sosiolingvistiikassa 
(ks. Sosiolingvistiikka tk.). Perinteisesti akkommodaation tutkimus on 


keskittynyt äänteelliseen modifiointiin vuorovaikutustilanteessa samaa 
kieltä puhuvien kesken, mutta modifioinnin on todettu koskevan myös 
muita kielen osa-alueita ja olevan keskeistä myös ei-äidinkielisten ja 
äidinkielisten sekä kielen eri varieteettien puhujien välisessä kielelli- 
sessä vuorovaikutuksessa. Eräs esimerkki akkommodaatiosta on aikui- 
sille kielenoppijoille suunnattu puhe (engl. foreigner talk), jonka roolia 
on pohdittu kieliliittotyyppisten ilmiöiden taustalla (ks. esim. Joseph 
2010, 624-628). Peter Trudgill (1986) on puolestaan tarkastellut 
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akkommodaation merkitystä kielenmuutoksessa murrekontaktien 
osalta. 

Koodinvaihto on monikielisille yhteisöille tyypillinen ilmiö, jossa 
puhuja käyttää elementtejä useammasta kielestä tai kielimuodosta sa- 
man puhetilanteen aikana. Koodinvaihdon tutkimus tarkastelee usein 
samantyyppisiä sosiolingvistisiä tekijöitä kuin akkommodaatiokin. Vaik- 
ka koodinvaihtoa on mahdollista tutkia myös vaikkapa kaunokirjallisessa 
korpuksessa, tyypillisesti tutkimuksessa käytetään kenttätyössä hankit- 
tua keskusteluaineistoa (ks. Kielten dokumentointi ja kieliopin kuvaus; 


Antropologinen lingvistiikka; Haastattelu aineistonkeruun metodina 
sosiolingvistiikassa tk.). Vaikka alalla ei vallitse yhtenäistä näkemystä 


koodinvaihdon ja sanaston lainautumisen suhteesta, on selvää, että 
molemmissa on kyse samankaltaisista prosesseista (ks. esim. Muysken 
2000, 75—78). 

Kielenvaihto eli tilanne, jossa puhujayhteisö siirtyy käyttämään toista 
kieltä kuin aiemmin, on jo varhain tunnettu kielisosiologinen asetelma 
— pohjautuvathan erilaiset substraattiselitykset juuri siihen. Käynnissä 
olevaa kielenvaihtoa alettiin kuitenkin tutkia puhujayhteisön ja yksi- 
lön kannalta vasta 1900-luvun loppupuoliskolla (ks. esim. tutkimuksen 
klassikko, Fishman 1964). Kielenvaihtoon liittyvä keskeinen käsite on 
kielikuolema (engl. language death, language loss; prosessiin viittaavana 
myös language obsolescence). Kielikuolema tarkoittaa tilannetta, jossa 
kieli ei enää välity sukupolvelta toiselle ja viimeisten puhujien kuolles- 
sa myös kieli katoaa. Kielikuoleman yhteydessä havainnoidaan usein 
käyttöalan kapenemisesta ja puhujayhteisön harvenemisesta johtuvia 
muutoksia kielessä (ks. Palosaari & Campbell 2011, 110-116). Saman- 
kaltaisia muutoksia tarkastellaan myös ensikielen attrition tutkimuk- 
sessa, jossa huomio on tyypillisesti yksilön ensikielen muutoksissa esi- 
merkiksi muutettaessa alueelle, jossa valtakieli on jokin muu (ks. esim. 
Schmid 2011). 

Kaksi- ja monikielisyyttä tutkitaan lukuisista eri näkökulmista (ks. 
esim. Edwards 1994). Varhaislapsuuden monikielisyyden tutkimuksen 
kysymyksenasettelut ja metodiikka ovat usein samoja kuin kielen omak- 
sumisen (engl. language acguisition) tutkimuksessa. Sosiolingvistisessä 
monikielisyyden tutkimuksessa tarkastelun kohteena ovat monikieliset 
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yhteisöt ja yksilöt. Näiden lähestymistapojen piirissä tutkitaan usein kie- 
li-identiteettiä ja monikielisyyttä resurssina sosiaalisessa vuorovaikutuk- 
sessa. Tällaisessa tarkastelussa kontaktilähtöiseen kielenmuutokseen ja 
esimerkiksi koodinvaihtoon liittyvä terminologia ja oletus diskreeteistä, 
selkeärajaisista kielimuodoista ovat saaneet osakseen kritiikkiä. Eritoten 
ilmiöiden diakroniaa tutkittaessa on aina tehtävä yleistyksiä kielistä, pu- 
hujayhteisöistä ja puhujista, mikä ei aina tee oikeutta esimerkiksi niille 
monille tekijöille, jotka vaikuttavat yksilön kielenkäyttöön. Tämä kri- 
tiikki on synnyttänyt esimerkiksi sellaisen käsitteen kuin kieleily (engl. 
languaging) kuvaamaan monikielisen yksilön toimintaa (kieleilyn ja 
kielikontaktin suhteesta ks. Lehtonen 2015, 304-307; ks. myös Lingvis- 


tinen etnografia toimintayhteisöissä tk.). 
Diakroninen ja synkroninen kielikontaktien tutkimus täydentävät 


toisiaan: on oletettava, että kaikkien historiallisten kontaktimuutosten 
taustalla ovat perusluonteeltaan samankaltaiset monikieliset käytänteet, 
joita on mahdollista havaita nykyhetkessä. Tästä huolimatta diakroni- 
sen ja synkronisen tason yhdistäviä, uskottavia kontaktilähtöisen kielen- 
muutoksen malleja on olemassa varsin vähän. Mainita voi kuitenkin 
kaksi eritoten koodinvaihdon tutkimuksesta ammentavaa kontaktiläh- 
töisen kielenmuutoksen mallia, Carol Myers-Scottonin (2002) ja Pieter 
Muyskenin (2013) mallit, joiden molempien keskiössä on kaksikielisen 
yksilön kielenkäyttö. 


3.3. Kontaktien historian tarkastelu niiden tulosten valossa 


Kielikontakteja voidaan joskus tutkia myös silloin, kun meillä ei ole juu- 
ri mitään historiallista tietoa kontaktitilanteesta. Paras esimerkki tästä 
on taas lainasanatutkimus: jos tietyt sanat pystytään äännehistorialli- 
sin ja muin kielihistoriallisin argumentein osoittamaan lainasanoiksi, 
ne kertovat itsessään kontaktin tapahtuneen, ja sanojen merkitykset 
voivat tällöin kertoa paljon muinaisen kontaktin luonteesta. Ulkoisia 
ehtoja ei oikeastaan ole muita kuin se, että kyseisten kielten varhaisem- 
mat muodot ovat voineet olla kosketuksissa keskenään eikä niitä ole 
esihistoriallisena aikana puhuttu esimerkiksi eri maanosissa. Kielten 
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puhuma-alueitten ei enää nykyään tarvitse olla kosketuksissa keskenään; 
esimerkiksi saamelaiskielissä on indoiraanisia lainasanoja. 
Lainasanatutkimuksen ansiosta tiedämme suomalaisten kielellisten 
esi-isien muinaisista kontakteista ensin arjalaisten eli indoiraanisten 
kielten puhujien, sitten balttilaisten kielten puhujien ja vielä germaanis- 
ten kielten (ei vielä ruotsin) puhujien kanssa — näiltä kaikilta olemme 
saaneet paljon keskeistä kulttuurisanastoa, mutta koska nämä kontaktit 
ovat tapahtuneet tuhansien vuosien aikana ennen ajanlaskumme alkua, 
meillä ei olisi niistä juurikaan tietoa ilman näitä lainasanoja (ajoituk- 
sesta ks. esim. Kallio 2006b). Myöhemmistä suomalaisten kontakteista 
itäslaavien kanssa on saatu jo ainakin jotain historiallista tietoa, mutta 
tässäkin tapauksessa lainasanatutkimus voi täydentää historian anta- 
maa kuvaa. Sellaiset slaavilaiset lainat kuin akkuna (> ikkuna), lusikka, 
palttina, värttinä, turku ja suntio vastaavat äänneasultaan vanhimmissa 
slaavilaisissa teksteissä esiintyviä sanoja ja ovat osittain jopa niitä ar- 
kaaisempia. Ne kertovat itämerensuomalais-slaavilaisten kontaktien 
alkaneen verrattain varhain, viimeistään ajanlaskumme ensimmäisen 
vuosituhannen puolessavälissä (ks. esim. Kallio 2006a), ja samalla ne 
antavat vahvistuksen monelle sellaiselle kantaslaavin äännepiirteelle, 
joka muuten jäisi kokonaan vertailevan rekonstruktion varaan (ks. His- 
toriallinen ja vertaileva kielentutkimus tk.). Kaikki lainasanat kuvastavat 


myös aikansa materiaalista ja henkistä kulttuuria (ks. yleisesityksiä lai- 
nautumisesta: Häkkinen 1990; Haspelmath & Tadmor 2009). 

Kieliopin muutos on huomattavasti vaikeampi osoittaa kontakti- 
lähtöiseksi, jos meillä ei ole historiallista tietoa kontaktitilanteesta. 
Mikä tahansa kieliopin piirre on voinut syntyä kielen sisäisen kehityk- 
sen tuloksena, ja kieliopin piirteet eivät koskaan ole niin ainutkertaisia 
kuin sanojen äänneasu. (Useamman kuin kahden vierekkäisen kielen 
samankaltainen kielioppipiirre on jo todennäköisemmin kontaktiläh- 
töinen, ja silloin puhumme kieliliitoista — ks. luku 3.4.) Toisin kuin lai- 
nasanat kielioppipiirre, joka on mahdollisesti lainautunut, ei myöskään 
kerro juuri mitään lainautumisajan kulttuurisen kontaktin laadusta, 
koska kieliopin rakenteella ja kulttuurilla ei ole suoraa suhdetta (vrt. 
kuitenkin luvut 3.5. ja 3.6. kontaktitilanteen ja kieliopillisen typologian 
suhteesta). 
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Jos halutaan antaa varoittava esimerkki siitä, mitä seuraa metodo- 
logisten vaatimusten höllentämisestä esihistoriallisten kielikontaktien 
tutkimuksessa, äärimmäinen tapaus on aikoinaan paljon julkisuutta 
saanut foneetikko Kalevi Wiikin (2002) teoria, jossa suuri osa euroop- 
palaisten kielten varhaisempaa historiaa selitettiin suomalais-ugrilaisen 
substraatin (ks. luku 2) avulla. Jos kaikki muutokset, jotka päällisin 
puolin tarkasteltuna voisivat olla kontaktilähtöisiä, myös oletetaan kon- 
taktilähtöisiksi ilman mitään riippumatonta tukea, lopputuloksena on 
mielikuvituksellinen rakennelma, jolla on enää vähän yhtymäkohtia 
tunnettuihin faktoihin. Wiikin metodologisiin virheisiin kuului myös 
se, että hän surutta hylkäsi uniformitarianismin eli sen lähtökohdan, 
että menneisyydessä on oletettava vallinneen samojen säännön- 
mukaisuuksien kuin nykyisyydessä, ellei meillä ole painavaa syytä olet- 
taa muuta. Hänen mallissaan substraattivaikutus, lingua francan käyttö 
tai metsästäjä-keräilijöiden kielialueiden koko noudattivat menneisyy- 
dessä aivan eri lainalaisuuksia kuin nykyisin. (Wiikin teoksen kriittisiä 
arvioita on julkaistu useita, joista yksi on Lindstedt [2004].) 

On kuitenkin olemassa lähestymistapa, jonka avulla naapurikielten 
kieliopillisia samankaltaisuuksia voidaan tarkastella jopa kaukaisen 
esihistorian näkökulmasta ilman, että sorrutaan perusteettomaan spe- 
kulointiin. Käänteentekevässä monografiassaan Linguistic Diversity in 
Space and Time Johanna Nichols (1992) osoitti, että monen kieliopilli- 
sen piirteen levinneisyys maailman kielissä korreloi kielten sijainnin 
kanssa koko maailman mittakaavassa. Monet piirteet muodostavat län- 
si-itäsuuntaisia kliinejä, toisin sanoen piirrettä kuvaava indeksi muut- 
tuu paikan monotonisena funktiona. ”Länsi” ja ”itä” määräytyvät tässä 
maapallon asutushistorian mukaan: länttä ovat Afrikka, josta ihmislajin 
ekspansio alkoi, Lähi-itä ja Eurooppa, itää ovat puolestaan Australia ja 
Etelä-Amerikka, jotka olivat ekspansion pääteasemia, ja niiden välissä 
ovat Tyynenmeren rannikko ja Pohjois-Amerikka. Nicholsin selitys tälle 
on se, että itäiset piirteet olivat itäisempien kielten piirteitä jo kymme- 
niä tuhansia vuosia sitten, kun ekspansio alkoi, eli ne edustavat laaje- 
nevan ihmiskunnan eturintaman piirteitä, kun taas läntisemmät piir- 
teet olivat leimallisia myöhemmin liikkeelle lähteneille ihmisryhmille 
(Nichols 1992, 254-259). Toki kielet ovat omaksuneet uusia alueittain 
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samankaltaisia piirteitä ihmiskunnan levittäytymisen jälkeenkin, mutta 
tällainen alueellinen konvergenssi ei olisi voinut tuottaa koko maailman 
mittaisia kliinejä. 

Nichols (1992) liikkuu sellaisessa aikasyvyydessä, johon historial- 
lis-vertaileva menetelmä ei ulotu (ks. Historiallinen ja vertaileva kielen- 
tutkimus tk.). Niinpä meillä ei ole mitään keinoa tietää, ovatko hänen 
löytämänsä vanhimmat alueelliset samankaltaisuudet kielisukulaisuu- 


den vai kielikontaktin aiheuttamia — todennäköisesti kyse on kummas- 
takin, mutta emme voi mitenkään tietää, missä suhteessa. Siitä huoli- 
matta hän on saanut varsin vakuuttavia tuloksia. Vaikka kielikontaktien 
tutkimus siis edellyttää areaalisuuden eli maantieteen huomioon otta- 
mista, areaalisuutta voidaan tutkia olettamatta mitään kielikontakteista. 
Seuraavassa kappaleessa palaamme kuitenkin sen verran pieniin aika- 
syvyyksiin, että areaalisuus ja kontaktit ovat liitettävissä toisiinsa. 


3.4. Areaalisuus: kieliliitot ja kontaktialueet 


Useimmiten kielikontaktien tutkimus selvittelee sitä, miten jokin piirre 
on lainautunut yhdestä kielestä toiseen, tai synkronisesti, miten jon- 
kin kielen elementit käyttäytyvät ja mitä niillä tehdään puhuttaessa 
toista kieltä. Mikäli lainanantajakieli on luonteeltaan superstraatti eli 
prestiisiltään korkeampi varieteetti, lainautuminen on todennäköisesti 
yksisuuntaista eli toinen kieli on lainojen lähde ja toinen vastaanottaja 
(ks. kuitenkin luku 3.6. L2-puhujien vaikutuksesta). Jos kielten välillä 
vallitsee kuitenkin adstraattisuhde ja kumpikaan kieli ei merkittävästi 
dominoi, on varsin luonnollinen kysymys, mitä tapahtuu lainanantaja- 
kielelle itselleen. Mikäli lainautumisen taustalla on kahden erikielisen 
yhteisön vuorovaikutus, jossa osa molempien kielten puhujista osaa 
ainakin jossain määrin myös toista kieltä, voi lainautumista tapahtua 
molempiin suuntiin. 

Kuten luvussa 2 todettiin, kielikontaktien tutkimuksen syntyyn liit- 
tyvät keskeisesti havainnot tietyillä alueilla puhutuista kielistä, joilla on 
paljon yhteisiä piirteitä, jotka eivät selity kielten sukulaisuudella. Tällais- 
ten alueiden nimitykseksi vakiintui 1900-luvun puolivälissä kieliliitto, ja 
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havaintoja tämän tyyppisistä kielellisistä alueista on tuon jälkeen tehty 
lukuisia. Tyypillistä näille havainnoille on se, että yhteisten piirteiden 
alkuperää ei tunneta, eli jaetut piirteet eivät selity esimerkiksi yhteisel- 
lä superstraatilla, mikä sekin voi kyllä johtaa samankaltaiseen loppu- 
tulokseen. Ajatellaan esimerkiksi Venäjän federaation vähemmistö- 
kieliä: lähes kaikki niiden puhujat osaavat myös venäjää, ja venäjästä 
voi näin ollen lainautua sama rakenne useampaan kieleen niin, että lai- 
nattujen piirteiden osalta vähemmistökielet saattavat alkaa muistuttaa 
toisiaan. Tällaista superstraattilähtöistä alueellista samankaltaisuutta ei 
kuitenkaan yleensä kutsuta kieliliitoksi. 

Eräs ainakin teoreettinen mahdollisuus, joka voisi johtaa niin ikään 
kielten samankaltaistumiseen tietyllä alueella, on yhteinen substraat- 
ti. Mikäli useamman kielen historiassa on tapahtunut kielenvaihtoa ja 
taustalla on kaikissa sama substraattikieli, voivat muutokset olla saman- 
kaltaisia. Tällaisten selitysten ongelma on usein se, että niitä on melkein 
mahdotonta osoittaa oikeiksi kiistattomasti. Substraattiselitysten aiem- 
man suosion taustalla lienee se, että substraatti oli varhaisimpia tunnet- 
tuja kielikontaktin tyyppejä ja muita mekanismeja tunnettiin huonosti. 
Fi ole kuitenkaan poissuljettua, etteikö jonkin tunnetun kieliliittoilmiön 
taustalla olisi ainakin osittain yhteinen substraatti. Esimerkiksi man- 
ner-Kaakkois-Aasian kieliliiton äänteelliset piirteet voivat hyvin selittyä 
mon-khmer-kielten (esim. vietnam) substraatilla (ko. kieliliitosta ks. 
Enfield 2005). Samaten Intian kieliliitolle luonteenomaiset retrofleksi- 
konsonantit voivat olla perua dravidakielten substraattivaikutuksesta 
indoarjalaisissa kielissä (Intian kieliliitosta ks. Emeneau 1956). 

Jos siis kieliliiton taustalla on yleensä ristiinlainautuminen prestiisil- 
tään suurin piirtein samanlaisten kielten välillä, onko kyseessä lopulta 
vain alue, jonka kielissä sattuu olemaan lainoja useammasta kielestä? 
Tällaista näkemystä edustaa esimerkiksi Lyle Campbell (2006), joka 
olisi valmis hylkäämään kieliliiton käsitteen ja puhumaan ainoastaan 
yksittäisten paikallisten lainojen kumuloitumisesta tietyllä alueella. Hie- 
man samassa hengessä Bernd Heine ja Tania Kuteva (2006, 286-287) 
asettuvat vastustamaan kieliliittojen osalta usein käytettyä konvergens- 
sin käsitettä, jolla kuvataan tilannetta, jossa kieliliiton kielten rakenteet 
lähentyvät toisiaan. Myös Heine ja Kuteva käsittelevät kieliopillisia 
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kontakti-ilmiöitä yksittäisten lainautumisprosessien kautta, ja heidän 
luomassaan mallissa on aina selkeästi tunnistettava lainan antaja ja 
vastaanottaja. 

Vaikka edellä mainittu kritiikki hyväksyttäisiin, tulee kuitenkin se- 
littää, miksi joillain alueilla tällaista monensuuntaista lainautumista 
tapahtuu ja miksi toisilla taas ei. Lisäksi herää kysymys siitä, miksi esi- 
merkiksi Balkanilla, jossa useamman alueen kielen historia tunnetaan 
melko hyvin, on kuitenkin usein mahdotonta määritellä jaetun piirteen 
alkuperää. Eräs tarjottu selitys on, että kieliliitto olisi sittenkin enemmän 
kuin yksittäisten lainautumisten summa: Jaetuilla piirteillä ei välttämät- 
tä ole Campbellin (2006) sekä Heinen ja Kutevan (2006) olettamaa sel- 
keää lähdettä, vaan kieliliiton taustalla oleva sosiolingvistinen asetelma 
suosii ja levittää tietyntyyppisiä rakenteita. Balkanin kieliliiton osalta 
monet jaetut piirteet ovat analyyttisiä rakenteita, jotka ovat korvanneet 
kaikissa kielissä aiemmat synteettiset rakenteet (Lindstedt 2019; Balka- 
nin kieliliitosta suomeksi ks. Lindstedt 2009a, jossa kartan selitykset 
ovat kuitenkin vaihtuneet keskenään; ks. myös luku 3.6.). 

Kieliliittojen tutkimus on osa niin kutsuttua areaalilingvistiikkaa, joka 
tarkastelee kielellisten piirteiden alueellista levikkiä. Useimmiten kieli- 
liittojen tutkimuksessa on taustalla jonkinlainen historiallinen hypotee- 
si niiden syntyyn vaikuttaneista tekijöistä. Usein kuitenkin havaitaan, 
että jollakin tietyllä laajallakin, esimerkiksi mantereen kokoisella maan- 
tieteellisellä alueella kielet suosivat tietyntyyppisiä rakenteita. Tästä seu- 
raa, että kielen puhuja-alueen maantieteellinen sijainti voi olla yhtä hyvä 
kielen rakenteen selittäjä kuin kielen kuuluminen johonkin kielikun- 
taan. Lauri Hakulinen (1968, 388—392) kiinnittää huomion siihen, että 
suomen kieli muistuttaa paljon muita eurooppalaisia kieliä sanastonsa 
rakenteeltaan johtuen lukuisista käännöslainoista. Östen Dahl (2008) 
laajentaa tarkastelun myös kielioppiin ja toteaa, että suomi on rakenne- 
piirteiltään varsin eurooppalainen kieli verrattuna esimerkiksi idempänä 
puhuttuihin sukukieliinsä. 

Suomen tapauksessa on selvää, että kielen rakenteiden osalta saman- 
kaltaisuuden täytyy olla seurausta kielikontakteista. Tämän tyyppisessä 
areaalilingvistisessä tarkastelussa kielikontaktit ovat kuitenkin vain yksi 
— joskin varteenotettava — kielipiirteiden alueellisen jakauman selittäjä. 
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Kun tarkastellaan jonkin piirteen levikkiä ja aineistona on edustava otos 
maailman kielistä, ei voida poissulkea sitä, etteikö piirteen edustumien 
taustalla olisi myös muinainen kielisukulaisuus. Tällaiset typologiset 
piirteet eivät kuitenkaan itsessään kelpaa todistusaineistoksi kielisuku- 
laisuudesta juuri sen vuoksi, että ne voivat levitä myös kontaktissa, ja 
kielisukulaisuuden todistamiseen tarvitaan aina historiallis-vertailevan 
kielitieteen menetelmiä säännöllisten äännevastaavuuksien löytämiseksi 
(ks. myös luku 3.3.; Historiallinen ja vertaileva kielentutkimus tk.). 
Havainnot kielipiirteiden alueellisesti merkitsevästä levikistä ovat 


johtaneet siihen, että määrällinen kielitypologinen tutkimus pyrkii aina 
huomiomaan areaalisia tekijöitä tarkastellessaan kielen universaaleja 
(ks. Kielitypologian menetelmät tk.). Tähän tarkoitukseen käytetään 
erilaisia otoksia, joissa maapallo on jaettu eri kokoisiin makroalueisiin 


(menetelmästä ks. Dryer 1989). Balkanin kaltaisten kieliliittojen tutki- 
muksen rinnalla mutta osittain myös siitä riippumatta on kehittynyt 
kooltaan huomattavasti suurempien makroalueiden tutkimus. Toisin 
kuin kieliliittojen makroalueiden synty on useimmiten sellaisessa aika- 
syvyydessä, että ei voida saavuttaa varmuutta siitä, juontuvatko jaetut 
piirteet kielikontakteista vai yhteisestä muinaisesta alkuperästä (ks. luku 
3.3.). Pääasiassa kontaktioletuksiin perustuvat makrotason mallit kilpai- 
levatkin usein selityksinä omnikomparativististen etäkielikuntien kans- 
sa. Näillä tarkoitetaan kielikuntahypoteeseja, jotka perustuvat kielten 
pinnallisiin äänteellisiin samankaltaisuuksiin (ks. myös Historiallinen 


ja vertaileva kielentutkimus tk.). 


3.5. Kontaktikielet 


Kielten välinen kontakti voi johtaa siihen, että syntyy uusia kieliä, jotka 
eivät ole kontaktitilanteeseen osallistuneiden kielten tytärkieliä käsitteen 
perinteisessä merkityksessä (ks. Historiallinen ja vertaileva kielentut- 
kimus tk.). Tällaisia uusia kieliä kutsutaan kontaktikieliksi — tosin ter- 
millä tarkoitetaan joskus mitä tahansa erikielisten välisessä kontaktissa 


käytettävää kieltä, mutta suppeammassa merkityksessä kontaktikielet 
eivät ole pelkästään käytössä kontaktitilanteessa, vaan ne ovat myös 
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syntyneet siinä. Tällaisten kontaktikielten kolme päätyyppiä ovat pid- 
ginit, kreolit (kreolikielet) ja sekakielet. Niiden tutkimus on itsenäinen 
lingvistiikan ala, jolla on omat vakiintuneet julkaisukanavansa (esimer- 
kiksi Journal of Pidgin and Creole Languages ja kirjasarja Creole Language 
Library, uudemmalta nimeltään Contact Language Library). Johdanto- 
tekstejä kontaktikielten tutkimukseen ovat esimerkiksi Bartens (2009), 
Thomason (2001, 157—221) ja Arends, Muysken ja Smith (1995). Laajem- 
pi kokoomateos on Kouwenberg ja Singler (2008). 

Pidginit eivät ole kenenkään äidinkieliä. Ne ovat syntyneet kahden 
tai useamman kielen puhujien kontaktitilanteessa, jossa eri kielten pu- 
hujat eivät ole osanneet toistensa kieltä mutta ovat joutuneet kommuni- 
koimaan keskenään esimerkiksi kaupankäynnin vuoksi. Vastoin yleistä 
käsitystä pidginit eivät ole ”sekakieliä”, jotka olisivat syntyneet kahden tai 
useamman kielen yhteensulautumisesta. Niiden sanasto on useimmiten 
pääosin peräisin yhdestä, prestiisiltään korkeammasta kielestä, jota kut- 
sutaan leksifioijaksi. Pidginien kielioppi puolestaan ei pohjaudu suoraan 
mihinkään muuhun kieleen vaan pikemminkin kuvastaa kommuni- 
kaation yksinkertaisia perustarpeita. Konkreettisessa kommunikaatio- 
tilanteessa puhujien omat äidinkielet voivat toki vaikuttaa puhunnosten 
muotoon, esimerkiksi sanajärjestykseen. Morfologiaa pidgineissä on 
hyvin vähän tai ei ollenkaan. 

Yksi tunnetuimmista pidgineistä oli lingua franca -niminen kieli, jota 
käytettiin Välimeren alueella ristiretkien ajalta 1800-luvulle asti (tätä ei 
pidä sekoittaa lingua franca -termin uudempaan käyttöön merkityksessä 
'yhteiskieli', esimerkiksi ”Englanti lingua francana”, ks. luku 2.). Sen lek- 
sifioijana olivat romaaniset kielet, erityisesti italia. Suomea lähin vakiin- 
tunut pidginkieli oli russenorsk, jota norjalaiset ja venäläiset kalastajat 
ja kauppiaat käyttivät kaupankäynnissään Jäämeren alueella 1700-luvun 
lopulta 1900-luvun alkuun. Russenorsk oli siinä mielessä poikkeuksel- 
linen pidgin, että sillä oli kaksi pääleksifioijaa, venäjä ja norja; sen li- 
säksi siinä oli esimerkiksi englantilaisia ja hollantilaisia sanoja, jotka 
merenkulkijoitten mukana ovat levinneet moneen muuhunkin maail- 
man pidginiin. Russenorskiksi käyty keskustelu aloitettiin usein lauseel- 
la moja po tvoja 'minä puhun sinun kieltäsi”, mikä viittaisi siihen, että 
norjalaisten mielestä russernorsk oli (eräänlaista) venäjää ja venäläisten 
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mielestä (eräänlaista) norjaa. Täydellisin lähde russenorskista on Broch 
ja Jahr (1984). 

Jotkin pidginit ovat saaneet äidinkielisiä puhujia; näin kävi erityisesti 
tietyissä siirtomaaolosuhteissa, esimerkiksi viljelyksillä, joilla työskenteli 
eri seuduilta kotoisin olevia orjia. Kun pidgin saa äidinkielisiä puhujia, 
sen käyttöala laajenee ja rakenne täydellistyy muitten äidinkielenä käy- 
tettävien ihmiskielten mukaiseksi, jolloin siitä tulee kreoli. Kreolikielellä 
on siis äidinkielisiä puhujia, mutta joskus aikaisemmin sillä ei ole ollut. 
Historiallisen kielentutkimuksen kannalta sanotaan, että sen historias- 
sa on ollut sukupolvien välisen siirron katko (engl. broken transmission) 
eikä se asetu minkään kieliperheen sukupuuhun samassa mielessä kuin 
katkeamatta siirtyneet kielet. Historiallis-vertailevaa menetelmää (ks. 
Historiallinen ja vertaileva kielentutkimus tk.) ei siis voi suoraan sovel- 


taa kreolien historian tutkimukseen. 

Tunnettu esimerkki kreoleista on haitinkreoli, jonka leksifioija on 
ranska (ja jota ei siis pidä sekoittaa Haitilla puhuttavaan ranskan varie- 
teettiin). Alankomaihin kuuluvilla Karibianmeren saarilla puolestaan 
puhutaan papiamentoa, jonka pääasiallinen leksifioija on portugali, 
mutta jossa on myös paljon espanja- ja hollantiperäistä sanastoa. Suo- 
malaisten päiväkotien sormileikkilaulua ”Täällä liikkuu viisi sormea” 
(san. Soili Perkiö) lauletaan usein myös eksoottisella vieraalla kielellä 
(sinku dede mi tin na mi man "viisi sormea minulla on kädessäni’), mutta 
juuri kukaan ei Suomessa tunnista kieltä papiamentoksi. 

Englantilaispohjaisia eli englannin leksifioimia kreoleja ovat esimer- 
kiksi tok pisin, joka on yksi Papua-Uusi-Guinean virallisista kielistä, 
ja Länsi-Afrikan pidginenglanti, jolle BBC vastikään avasi oman uutis- 
kanavan". Kumpikaan kieli ei siis nimestään huolimatta ole enää pidgin 
vaan kreoli. 

Jotkut tutkijat ovat sitä mieltä, ettei kreolin synty aina edellytä edeltä- 
vää pidginiä. Thomason ja Kaufman (1988, 147-166) ovat esittäneet, että 
esimerkiksi erikielisten orjien keskuudessa saattoi tapahtua ”äkillinen 
kreoloituminen”: heti ensimmäisten orjille syntyneiden lasten (yhdeksi) 
äidinkieleksi tuli heidän vanhempiensa puutteellisesti oppima siirto- 
maaisäntien kieli, ja kreoli syntyi ilman edeltävää pidginvaihetta. Aina- 
kin osittain tämä on myös määrittelykysymys, sillä irrallisista yrityksistä 
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kommunikoida huonosti osatulla kielellä on jatkumo rakenteeltaan jos- 
sakin määrin vakiintuneeseen pidginiin. Varmaankaan kreolin syntymi- 
nen ei ole aina edellyttänyt vakiintunutta pidginiä. 

On myös mainittava se käsitys, jonka puolesta on argumentoinut esi- 
merkiksi Salikoko Mufwene (2008, 115-201), että kreolit eivät muodosta 
mitään poikkeuksellista ryhmää ihmiskielten joukossa. Hänen mukaan- 
sa latinan muuntuminen ranskaksi kielenvaihdon kautta ja kielikon- 
taktien vaikutuksen alaisena oli aivan samankaltainen prosessi kuin 
ranskan muuntuminen haitinkreoliksi, joka siis kuuluu romaanisten 
kielten sukupuuhun yhtenä normaalina haarana. Kreolikielet on erotel- 
tu omaksi ryhmäkseen vain niiden puhujien alhaisen yhteiskunnallisen 
statuksen vuoksi. Mufwenen ajatukset ovat terveellinen muistutus siitä, 
että kontaktilingvistiikan ilmiöt eivät voi olla täysin erilaisia kreoleiden 
synnyssä kuin muitten ihmiskielten kohdalla. Toisaalta Mufwene ei 
kuitenkaan ota kantaa siihen periaatteelliseen metodologiseen eroon, 
ettei kreoleita voi käyttää historialliseen rekonstruktioon (esim. tok pisi- 
niä kantagermaanin rekonstruktioon) samalla tavalla kuin muita kieliä 
(Thomason & Kaufman 1988, 200-201). Niiden historiassa on siis ol- 
lut poikkeuksellisen uudelleenjärjestäytymisen vaihe, vaikkeivät kaikki 
tutkijat halua kutsua sitä katkenneeksi siirroksi. McWhorter (2018) argu- 
mentoi vahvasti sen puolesta, että kreolit ovat kuin ovatkin alkuperältään 
ainutlaatuisia ja itse asiassa ainoita aidosti uusia ihmiskieliä. 

Yleisen kontaktilingvistiikan kannalta on tässä yhteydessä hyvä va- 
roittaa muutamasta termistä. Kreoloituminen tarkoittaa pidginin koh- 
dalla sitä, että se nativisoituu eli saa äidinkielisiä puhujia ja alkaa hei- 
dän puheyhteisössään muuttua. Kreoloitumiseen liittyy siis rakenteen 
ja funktioiden kehittyminen ja monimutkaistuminen. Mutta jos asiaa 
tarkastellaan leksifioijakielen kannalta, ”kreoloituminen” saattaakin 
päin vastoin tarkoittaa rakenteen yksinkertaistumista, koska kreoleilla 
on yksinkertaisempi kielioppi kuin leksifioijalla (tosin tästäkin on eri 
käsityksiä, ks. luku 3.6.). Varsinkin Thomasonin ja Kaufmanin (1988) 
esittämä ”äkillinen kreoloituminen” olisi ennemmin yksinkertaistumis- 
ta kuin monimutkaistumista. Dekreoloituminen taas tarkoittaa sitä, että 
kreoli alkaa rakenteeltaan lähestyä leksifioijaa ja lainaa siltä sanastoa ja 
kielioppia, koska sillä on suurempi prestiisi. 
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Sen sijaan on syytä välttää kreoloituminen-termin käyttöä kuvaa- 
maan mitä tahansa kielen rakenteen radikaalia muutosta kontakti- 
tilanteessa, jos tuloksena ei ole kreolikieli. Esimerkiksi afrikaansia ei 
pidä kutsua ”kreoloituneeksi hollanniksi”, koska kielen siirto sukupol- 
velta toiselle ei hollannin ja afrikaansin välissä ole missään vaiheessa 
katkennut. Jos halutaan korostaa ei-äidinkielisten puhujien (toden- 
näköisesti vahvaa) roolia sen kehityksessä (Thomason & Kaufman 
1988, 251-256), tarjolla on sellaisia termejä kuin kreoloidi ja semikreoli. 
Tämäkin liittyy seuraavassa luvussa 3.6. käsiteltävään kysymykseen 
ei-äidinkielisten puhujien merkityksestä kielen typologisen muutok- 
sen kannalta. 

Termit superstraatti ja substraatti ovat kreolistiikassa käytössä hieman 
eri merkityksessä kuin muussa kontaktilingvistiikassa. Superstraatilla 
tarkoitetaan useimmiten leksifioijaa tai muuta kreoliin vaikuttavaa, 
prestiisiltään korkeaa kieltä. Substraatti taas tarkoittaa niitä kieliä, jotka 
olivat kreolia edeltävän pidginin puhujien äidinkieliä. Yksi keskeinen 
kysymys kreolistiikassa on, missä määrin kreolien kielioppi on peräisin 
superstraatista, substraatista tai kielellisistä universaaleista. 

Termiä sekakieli (engl. mixed language) käytetään kontaktilingvistiikas- 
sa paljon vähemmän kuin yleisessä kielenkäytössä. Se, että jokin kieli on 
lainannut paljon sanastoa toiselta, ei tee siitä sekakieltä: englanti on yhä 
germaaninen kieli, vaikka se on lainannut paljon ranskasta, jiddi$ on 
myös germaaninen kieli slaavilaisista ja heprealaisista lainoistaan huo- 
limatta, ja albania on yhä oma haaransa indoeurooppalaisessa kieliper- 
heessä, vaikka sen suoraan kantakielestä peritty sanasto on supistunut 
pieneksi romaanisten ja slaavilaisten lainojen tieltä. 

Kansanomaisissa esityksissä pidginit ja kreolit selitetään joskus kah- 
den tai useamman kielen sekoituksiksi, mitä ne siis missään tapaukses- 
sa eivät ole. Maailmassa on kuitenkin muutamia todellisia sekakieliä, 
jotka muodostavat pidginien ja kreolien ohella kontaktikielten kolman- 
nen ryhmän (Thomason 2001, 196-221). Ne eivät ole syntyneet erikie- 
listen väestöjen kohtaamisessa vaan yhden väestöryhmän keskuudessa 
kahden kielen kohdatessa. Sen sijaan, että ryhmä hylkäisi alkuperäisen 
kielensä valtakielen levitessä heidän alueelleen, se luokin uuden kielen, 
jossa on elementtejä kummastakin. 
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Sekakielille on tyypillistä, että kielen pääkomponentit, esimerkiksi 
sanasto, substantiivien morfologia tai verbien morfologia, voivat olla 
selvästi eri lähteistä. Esimerkiksi Mednyisaaren aleutti, jota puhuttiin 
1800-luvulla ja vielä 1900-luvullakin pienellä Tyynenmeren saarella 
Kamtsatkan itäpuolella, oli muuten sanastoltaan ja kieliopiltaan aleut- 
tia, mutta aleutin monimutkainen finiittiverbien morfologia oli korvattu 
venäjän mukaisella verbitaivutuksella. Ecuadorissa puhuttavan media 
lengua -kielen kielioppi puolestaan pohjautuu ketSuaan mutta sanasto 
espanjaan; puhujat muodostavat oman ryhmänsä, jotka eivät identifioi- 
du ketSuan tai espanjan puhujiksi. Myös nk. pararomanikieliä, joissa 
romanikielen sanasto liittyy paikallisen kielen (esimerkiksi englannin tai 
suomen) kielioppiin (Matras 2002, 242-248), voi pitää sekakielinä. Tässä- 
kin vain on ongelmana, että määrittelystä riippumatta termi sekakieli tuo 
puhujille itselleen ja laajemmalle yleisölle aina negatiivisia assosiaatioita. 

Sekakielten tutkimuksen kannalta mielenkiintoinen kielimuoto on 
helsinkiläinen stadin slangi — nimenomaan sen alkuperäinen, 1800- 
ja 1900-lukujen vaihteessa puhuttu versio, jossa kielioppi oli suomen 
mukainen mutta sanasto pääosin ruotsista (Kallio 2007). Se ei ollut 
yllä kuvatun kaltainen sekakieli siinä mielessä, että sillä olisi ollut äi- 
dinkielisiä puhujia, mutta se oli kuitenkin tietyn ryhmän identiteetin 
merkitsin. Toisaalta se ei oikein muistuta pidginiäkään, koska sillä oli 
monimutkainen, yhdestä kielestä lainattu kielioppi. Joka tapauksessa 
sitä voidaan pitää suomen ja ruotsin kontaktista syntyneenä varieteettina 
- kummallakin kielellä oli tuohon aikaan suunnilleen yhtä paljon puhu- 
jia Helsingissä (Kallio 2007, 176) — mutta on määrittelykysymys, oliko 
se uusi kontaktikieli vaiko vain suomen erikoinen kontaktivarieteetti 
(eli varieteetti, jossa kontaktivaikutus on huomattavan voimakas saman 
kielen muihin varieteetteihin verrattuna). Koska Kallio pitää kieliopillisia 
elementtejä kielisukulaisuuden määräävänä tekijänä, hän pitää stadin 
slangia suomalais-ugrilaisten kielten sukupuuhun kuuluvana. Tällä 
perusteella media lenguakin olisi ehkä ketsuan sukukieli, ei sekakieli, 
mutta Mednyisaaren aleutin luokittelu aleutin tai venäjän sukukieleksi 
olisi jo mielivaltaista, koska jako kulkee keskeltä kielioppia. 

Lindstedt (2009b) on esittänyt, että kontaktikielten tutkimuksen 
metodeja voidaan käyttää jopa esperanton alkuperän, muutoksen ja 
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äidinkielistymisen tutkimuksessa. Esperanton peruskielioppi ja -sa- 
nasto suunniteltiin tietoisesti, mutta esperantonkielisissä teksteissä ja 
sen puhujien kielenkäytössä on runsaasti ilmiöitä, jotka eivät kuvasta 
julkaistuja suppeita kielioppeja vaan ovat sen kieliympäristön vaiku- 
tusta, jossa kieltä on käytetty. Esperantoa voidaan tässä mielessä pitää 
kontaktikielenä, jossa on romaanis-germaaninen superstraatti ja slaa- 
vilainen substraatti (kreolistiikassa käytetyssä merkityksessä, ks. ylh.). 
Äidinkieliset esperanton puhujat ovat jossain määrin samassa tilantees- 
sa kuin pidginiä kreoloivat varhaiset puhujat. 

Kielikontaktien tutkimuksen kannalta tärkein kontaktikielten anta- 
ma opetus on, ettei ihmiskielessä ole mitään osaa, johon tietynlainen 
kontaktitilanne ei voisi vaikuttaa radikaalistikin. Kreolistiikan piirissä 
syntyneillä tavoilla tarkastella kielten sosiohistoriallista taustaa ja kie- 
len siirtoa sukupolvelta toiselle on paljon annettavaa myös sellaisten 
varieteettien tutkimukselle kuin afrikaans tai stadin slangi, jotka eivät 
ainakaan ilmeisen selvästi ole itse kontaktikieliä tämän osan alussa ku- 
vatussa suppeammassa mielessä. 


3.6. Kielikontaktien vaikutus kielen tyyppiin 


Kontaktit eivät tuo kieleen pelkästään yksittäisiä toisista kielistä lainat- 
tuja piirteitä, vaan ne voivat vaikuttaa myös kielen koko rakenteeseen. 
Tämä liittää kontaktien tutkimuksen kielitypologiaan ja sen piirissä käy- 
tyyn keskusteluun kielten kompleksisuudesta eli monimutkaisuudesta 
ja sen vähenemisestä eli yksinkertaistumisesta. 

Strukturalistisessa kielentutkimuksessa oli pitkään vallalla aksiooma, 
jonka mukaan kaikki kielet ovat yhtä monimutkaisia (ks. Kusters 2003, 
1-5). Tämä oli aikanaan ymmärrettävä reaktio niihin varhaisempiin 
etnosentrisiin käsityksiin, joiden mukaan useimmat kielet ovat joten- 
kin primitiivisempiä kuin indoeurooppalaiset ja mahdollisesti seemi- 
läiset kielet (vaikka jo Darwin tiesi tämän käsityksen vääräksi, vrt. ”[t]he 
perfectly regular and wonderfully complex construction of the languages 
of many barbarous nations”; Darwin 1874, luku III, jossa viitataan kieli- 
typologian pioneeriin Friedrich Schlegeliin). Koska kielihistoriassa on 
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kuitenkin helppo löytää esimerkkejä kielen jonkin osan ilmeisestä yk- 
sinkertaistumisesta (esimerkiksi latinan monimutkaisen taivutusmorfo- 
logian yksinkertaistumisesta ja kadosta romaanisissa kielissä), yhtäläi- 
sen kompleksisuuden aksioomaa oli täydennettävä sillä oletuksella, että 
yksinkertaistavan muutoksen jotenkin kompensoi kielen jonkin toisen 
komponentin monimutkaistuminen. Tällaiselle oletukselle ei kuiten- 
kaan ole löytynyt empiiristä tukea, eikä kukaan myöskään ole voinut 
esittää, millainen koko kielen kattava säätelymekanismi pitäisi huolen 
tällaisesta kompleksisuuden kokonaishallinnasta (Trudgill 2011, 15-16). 
Kokonaiskompleksisuuden mittaaminen olisi sitä paitsi vaikeaa, kos- 
ka emme tiedä, mitkä kaikki piirteet pitäisi ottaa huomioon tai miten 
asettaa kielen eri tasoja kuvaavat mittarit samalle asteikolle (Miestamo 
2017, 238). 

Nykyään on voittamassa alaa se käsitys, että on mielekästä puhua 
eri kielten kompleksisuuden eroista, kunhan määritellään, millaista 
kompleksisuutta tarkoitetaan. Dahl (2004, 19-55), McWhorter (2011, 
1-2) ja Trudgill (2011, 15-24) ovat analysoineet kompleksisuus-käsitteen 
eri puolia. Usein esitettyjä parametreja ovat 1) sääntöjen monimutkai- 
suus, eli kuinka laaja on kieliopin jonkin osan tyhjentävä kuvaus, 2) läpi- 
näkyvyyden puute kieliopissa tai leksikossa, eli kuinka kaukana ollaan 
"yksi merkitys — yksi muoto” -periaatteesta (vrt. Anttila 1972, 100—102, 
passim), ja 3) redundanssi, eli vaatiiko kielioppi merkitsemään seikko- 
ja, jotka selviävät kontekstista (paradigmaattinen redundanssi) tai jotka 
on jo merkitty toisessa kohtaa lausetta (syntagmaattinen redundanssi). 
Redundanssi lisää ennen kaikkea kielen puhujan prosessointitaakkaa, 
mutta kuulijan kannalta se on viestin ymmärtämistä helpottava. Mies- 
tamo (2008; 2017) on esittänyt, että kompleksisuuden mittaaminen on 
redusoitavissa kahteen parametriin: kuinka monia semanttisia tai prag- 
maattisia erotteluja kielessä merkitään, ja kuinka kaukana ollaan ”yksi 
merkitys — yksi muoto” -periaatteesta. 

Kompleksisuus korreloi varsin pitkälti sen kanssa, kuinka helppoa 
kieltä on oppia vieraana kielenä kriittisen kielenomaksumisiän jälkeen, 
mutta tämä L2-vaikeus on kuitenkin erillinen, empiirisesti tutkittavis- 
sa oleva suure, joka on ainakin osittain sidoksissa oppijan ensikielen 
rakenteeseen. Jos kielessä on foneemisia tooneja (kuten kiinassa) tai 
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tonaalisia aksentteja (kuten ruotsinruotsissa), ne eivät välttämättä tee 
kielen fonologian kuvauksesta kovin paljon monimutkaisempaa mutta 
saattavat silti olla huomattavan vaikeita L2-oppijan kannalta. 

Edellisessä luvussa 3.5. käsiteltyjen pidginien ja kreolien tutkimuk- 
sessa yksi keskeinen kysymys on ollut, ovatko tällaiset kontaktikielet 
rakenteeltaan jossakin mielessä yksinkertaisempia kuin muut ihmis- 
kielet. Pidginien osalta kysymys ei ole kovinkaan kiistanalainen, koska 
ne eivät ole kenenkään äidinkieliä ja niiden käyttöala on rajattu, joten 
niiden rakenteellinen yksinkertaisuus on odotuksenmukaista. Mutta 
kun McWhorter (2001) esitti, että kreolikielten kieliopit ovat yksin- 
kertaisempia kuin muitten äidinkielinä puhuttujen kielten, monet 
kielentutkijat olivat jyrkästi eri mieltä (jo samaan Linguistic Typology 
-lehden numeroon oli kerätty monia kommenttipuheenvuoroja). Vasta- 
väitteiden takana oli selvästikin pelko, että yhteiskunnalliselta arvos- 
tukseltaan alhaisten kreolikielten nimittäminen yksinkertaisiksi estäisi 
niiden emansipaatiota ja olisi jopa rasistista. 

McWhorterin teos (2011) kielten yksinkertaisuudesta ja monimutkai- 
suudesta perustelee hänen argumenttejaan laajemmin. Hänen perustee- 
sinsä, jonka mukaan kielten kompleksisuuserot riippuvat merkittävästi 
siitä, mikä rooli toisen kielen oppimisella ja siis L2-puhujilla on ollut 
niiden historiassa, on sovellettavissa muihinkin kieliin kuin kreoleihin, 
vaikka kreolit ovat tietysti tässä mielessä selvin tapaus. Kustersin (2003) 
uraauurtava väitöskirja osoitti, kuinka arabian, skandinaavisten kielten, 
ketsuan ja suahilin tiettyjen varieteettien verbintaivutus yksinkertaistui 
niiden levitessä nopeasti laajoille alueille ja saadessa paljon L2-puhujia. 
Tällaiset tutkimukset kumosivat oikeastaan kaksikin strukturalistisen 
lingvistiikan aksioomaa: paitsi sen, että kaikki kielet ovat yhtä monimut- 
kaisia, myös sen, ettei kielen rakenne riipu yhteiskunnallisesta ympäris- 
töstä. Kielten leviäminen ja niistä johtuvat kielikontaktit ja La-puhujien 
lisääntyminen ovat kaikki kielten sosiologiaan liittyviä tapahtumia. 

On kuitenkin tärkeää huomata, että kielikontaktien on todettu myös 
monimutkaistavan kieltä. Nichols (1992, 192-195) huomauttaa, että 
monilla maapallon alueilla, joissa kielellinen diversiteetti on korkea ja 
puhujat ovat usein monikielisiä, kielet ovat rakenteeltaan hyvin moni- 
mutkaisia. Esimerkkejä ovat Kaukasus, luoteinen Pohjois-Amerikka ja 
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Uusi-Guinea (vrt. Trudgill 2011, 29-32). Tallaisilla alueilla on paljon 
kielikontakteja, mutta mikään kieli ei ole levinnyt laajemman alueen 
lingua francaksi. 

Trudgill (2011, 40—43) pyrkii selittämään, miksi kielikontaktit näyttä- 
vät toisinaan yksinkertaistavan, toisinaan monimutkaistavan kontakti- 
tilanteisiin osallistuvia kieliä. Verrattain pinnallinen kontakti, johon 
liittyy ensi sijassa vain sanaston lainaamista, ei todennäköisesti muuta 
siihen osallistuvien kielten tyyppiä ollenkaan. Laajamittaisempi kon- 
takti sen sijaan johtaa erilaisiin typologisiin muutoksiin sen mukaan, 
millaiseen yksilötason kaksikielisyyteen se perustuu. Samalla alueella 
puhuttavien kielten välinen pitkäaikainen kontakti, jossa lapsetkin ovat 
sujuvasti kaksi- tai monikielisiä, johtaa kielten monimutkaisuuden kas- 
vuun, kun puhujat lisäävät kieliin toisista kielistä lainattuja piirteitä. Sen 
sijaan kontaktitilanne, jossa aikuiset joutuvat nopeasti opettelemaan 
heille oudon kielen, johtaa tämän kielen vähittäiseen yksinkertaistumi- 
seen, jos L2-puhujia on kielen puheyhteisössä paljon tai jos heillä on 
korkea prestiisi (jos he ovat esimerkiksi vierasperäinen eliitti). 

Balkanin kieliliittoa tutkinut Lindstedt (2019) on lisännyt tähän vielä 
kolmannen tyypin: Balkanin kielten pitkäaikainen kontakti keskiajan 
lopulla ja uuden ajan ensimmäisinä vuosisatoina perustui ennen kaik- 
kea aikuisten stabiiliin pitkäaikaiseen monikielisyyteen. Sen tuloksia 
Balkanin kielissä ei voi pitää yksiselitteisesti yksinkertaistavina tai moni- 
mutkaistavina, vaan tuloksena oli ennen kaikkea kieliopillisten piirteit- 
ten eksplisiittinen merkintä analyyttisesti eli erilaisilla partikkeleilla, ar- 
tikkeleilla ja prepositioilla. Kielet lainasivat toisiltaan uusia kieliopillisia 
piirteitä, esimerkiksi evidentiaalisuuden tai määräisyyden pakollisen 
merkinnän, mikä lisäsi kompleksisuutta sekä sääntöjen että redundans- 
sin muodossa, mutta niiden merkinnässä lisääntyi läpinäkyvyys, mikä 
puolestaan oli yksinkertaistava muutos. 

Kielikontaktien kielioppia yksinkertaistava vaikutus on ollut yksi seli- 
tysmalli monen eurooppalaisen kielen historian tutkimuksessa. Useim- 
mat romaaniset kielet ovat kokonaan kadottaneet latinan sijataivutuk- 
sen, mikä voidaan selittää sillä, että latina levisi läntiseen ja eteläiseen 
Eurooppaan ensi sijassa kielenvaihdon kautta ja oli siis aikoinaan suurelle 
osalle puhujistaan toinen kieli (Clackson & Horrocks 2007, 276). Latinan 
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sijamuodot ovat osittain säilyneet romaniassa ja sen Balkanilla puhutta- 
vissa lähisukukielissä, mikä taas voidaan selittää Balkanin muitten kielten 
sijajärjestelmän niille antamalla tuella verrattain stabiilissa kielikontakti- 
tilanteessa, jossa ei tapahtunut pelkästään yksisuuntaista laajamittaista 
kielenvaihtoa (Lindstedt 2014, 172-175; Wahlström 2015, 130-131). 

Englannin kielen historia on hyvä esimerkki siitä, että kontak- 
tien vaikutusta kieliopin yksinkertaistumiseen ei ole helppo tutkia. 
Britanniassa puhuttiin kelttiläisiä kieliä englannin puhujien saapuessa 
400-500-luvuilla. Sen jälkeen englantiin ovat vaikuttaneet ainakin vii- 
kinkien muinaisskandinaavi 700-luvulta lähtien, maan valloittaneiden 
normannien ranskan kieli vuodesta 1066 lähtien sekä vielä myöhem- 
pien maahanmuuttajien hollanti ja alasaksa (Thomason & Kaufman 
1988, 265—269, 321-325; Filppula 2013). Jo klassisessa kielikontakti- 
teoksessaan Thomason ja Kaufman (1988, 263-331) käyvät laajasti läpi 
todistusaineistoa ja vertaavat englannin kehitystä muitten germaanisten 
kielten kehitykseen. Heidän johtopäätöksensä on, että englannin kieli- 
opin yksinkertaistumista kantagermaanista lähtien ei voi pitää tuloksena 
kontaktista muinaisskandinaavin, ranskan tai myöhempien kontakti- 
kielten kanssa vaan normaalina sisäsyntyisenä kehityksenä. McWhorter 
(2002) argumentoi kuitenkin, että nimenomaan skandinaavinen kon- 
takti muutti voimakkaasti englannin kielioppia. Viime aikoina on puo- 
lestaan esitetty argumentteja sen puolesta, että englantia yksinkertais- 
tikin varhaisempi kelttiläisten kielten ja englannin välinen kontakti ja 
kielenvaihto, joka jatkui Pohjois-Englannissa pitempään kuin aikaisem- 
min on ajateltu (Trudgill 2011, 50-55; Filppula 2013). McWhorter (2011, 
261-295) on hänkin tarkastellut kelttiläistä vaikutusta, jota hän pitää 
varmana, vaikkei se hänen mukaansa ole ollut niin yksiselitteisesti kieltä 
yksinkertaistavaa kuin skandinaavinen vaikutus; hänen mukaansa eng- 
lanti on semikreoli (ks. luku 3.5.). 

Kielikontaktien typologinen vaikutus on siis ollut kiistanalaista jopa 
englannissa, jota on tutkittu paljon ja jonka sisäinen ja ulkoinen historia 
tunnetaan hyvin. Metodologinen opetus tästä on, että mitä laajemmis- 
ta kieliopillisista muutoksista on kyse, sitä epävarmemmiksi kontakti- 
pohjaiset selitykset käyvät, vaikkei olekaan mitään periaatteellista syytä, 
miksi kontaktiselitykset olisivat huonompia kuin kielen sisäisiin syihin 
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vetoavat selitykset. Luonnollisesti yhtä kieltä tutkittaessa ei voida olla 
oikopäätä varmoja siitä, mikä lopulta on ollut kielikontaktien ja kielen si- 
säisten, esimerkiksi sananloppuisten fonologisten muutosten keskinäi- 
nen osuus, mutta kun tietynlaisten sosiolingvististen kontaktitilanteiden 
osoitetaan johtavan eri kielissä säännöllisesti samanlaisiin muutoksiin 
(esimerkkinä edellä siteerattu Kusters 2003), kontaktiselityksen paino 
jokaisessa yksittäistapauksessakin kasvaa. Selitys voi olla myös sisäisten 
syiden ja useamman kuin yhden kontaktitilanteen yhteisvaikutus, kuten 
Wahlström (2015) on osoittanut tutkimuksessaan sijataivutuksen kados- 
ta bulgariassa ja makedoniassa. 


4. Yhteenveto: mitä kielikontaktien tutkijalta 
vaaditaan 


Kuten tässä artikkelissa on käynyt ilmi, kielikontaktien tutkimus voi 
koskea mitä tahansa kielen tasoa, mikä johtuu puolestaan siitä, että 
kontaktilähtöinen kielenmuutos voi tapahtua millä tahansa kielen tasolla 
ääntämyksestä semantiikkaan ja pragmatiikkaan. Kielikontaktien tutki- 
jan tulee näin ollen tuntea sitä kielitieteen alaa, joka hänen tarkastele- 
miaan ilmiöitä tutkii. Laajasti käytettyjä, helposti sovellettavia malleja ei 
kielikontaktien tutkimuksessa juurikaan ole, ja kontaktien tutkijan tar- 
vitsemaa metodologista osaamista ei ole aivan yksinkertaista määritellä. 

Sarah Thomason (2010) kuvaa artikkelissaan sitä, millaisen tutkimus- 
prosessin kautta jonkin ilmiön kontaktilähtöisyys voidaan osoittaa. 
Prosessi ilmentää hyvin niitä erilaisia metodologisia valmiuksia, jotka 
voivat olla kontaktien tutkijalle tarpeen. Tutkittavia kieliä tulee tuntea 
kokonaisuutena, jotta voisi todeta, onko kielessä muita lainautuneita ra- 
kenteita. On myös kyettävä tarvittaessa osoittamaan, että ilmiön synnyn 
aikaan on vallinnut lainautumiselle otollinen sosiolingvistinen tilanne. 
On toisin sanoen tunnettava tutkittavan kielen kehityshistoriaa ja mah- 
dollisesti myös puhujayhteisön kielenulkoista historiaa, tai jos kyse on 
tuoreesta ilmiöstä, sen nykyistä tilannetta. 
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Jotta taas kykenisi määrittelemään, mikä lainattua rakennetta lähtö- ja 
kohdekielessä yhdistää, on pystyttävä käyttämään laajemmin yleistettä- 
vissä olevia vertailukäsitteitä, jotka eivät nojaa pelkästään yhden kielen 
kuvaus- ja tutkimustraditioon. Tällaista otetta vaaditaan myös kontrastii- 
visessa kielentutkimuksessa, jossa kieliä vertaillaan myös ilman oletusta 
niiden välisestä kontaktivaikutuksesta (ks. kielten vertailun metodiikasta 
Kolehmainen, Miestamo & Nordlund 2013). Osoittaakseen, että kontakti- 
ilmiö todella on uusi kohdekielessä — tai vanha lähtökielessä —, tulee tut- 
kijan verrata tutkittavia kieliä niiden sukukieliin tai varhaisempiin kieli- 
muotoihin. Tällöin kyseeseen tulevat esimerkiksi historiallis-vertailevan 
kielentutkimuksen menetelmät, tai jos epäilty kontaktimuutos on näh- 
tävissä kirjallisessa aineistossa, myös historiallinen korpustutkimus voi 
olla tarpeen (ks. Historiallinen korpuslingvistiikka tk.). 


Edellä kuvatut menetelmälliset valmiudet eivät koske pelkästään kon- 
taktitutkimusta. Usein kielikontaktien tutkijan erikoisosaaminen on 
tutkittavien kielten, niiden puhujayhteisöiden ja erityyppisten kielikon- 
taktitilanteiden tuntemusta. Fi riitä pelkästään, että tuntee kielen, jossa 
tapahtuvia ilmiöitä havainnoi, vaan myös muutoksen lähteenä olevaa 
kieltä on syytä tuntea. Jos tarkastellaan synkronisia ilmiöitä ja käytetään 
esimerkiksi keskusteluaineistoa, korostuu tutkijan kielitaidon merkitys 
entisestään. Jos taas kyse on diakronisesta tutkimuksesta, on tunnetta- 
va myös niitä kielen varieteetteja, joihin otaksuttu kontakti ei ole vai- 
kuttanut ja joiden voi näin ollen olettaa edustavan paremmin kontaktia 
edeltänyttä tilannetta. Toisaalta kun aineistona on typologinen piirreotos 
kuten makroalueiden tutkimuksessa, ei yksittäiskielten osaaminen ole 
välttämätöntä. Tällöin tarvitaan kuitenkin ymmärrystä kielityypeistä ja 
siitä, millaisin vertailukäsittein yksittäiskielten ilmiöt voidaan rinnastaa 
toisiinsa (ks. Kielitypologian menetelmät tk.). 

Tässä artikkelissa on osoitettu, että kielikontakti-ilmiöiden selittä- 


minen kietoutuu aina puhujayhteisöissä vallitsevien sosiolingvististen 
asetelmien ymmärtämiseen. Usein on yhtä tärkeää havainnoida kielen- 
käyttötilanteita kuin niitä kielen rakenteita, joissa ilmiö esiintyy. Jos- 
kus kontakti-ilmiön todistaminen jopa vaatii, että pystyy osoittamaan 
kontaktitilanteen olleen sen kaltaisen, että lainautuminen on ylipäätään 
ollut mahdollista. Myös monikielisten käytänteiden tarkastelu sinänsä 
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on osa kielikontaktitutkimusta laajassa mielessä. Kontaktiin johtaneen 
tilanteen ymmärtämisessä mikään ei voita sitä kokemusta, joka saavu- 
tetaan oleskelemalla tutkittavan puhujayhteisön parissa — silloinkin kun 
aineistoa ei hankita kenttätyössä. 

Tutkija operoi aina myös intuitiollaan, jossa on kyse tiedon ja koke- 
muksen yhdistelmästä. Tuottaakseen tutkittavia hypoteeseja kontakti- 
tutkijan tulee tuntea kontakti-ilmiöitä yleensä: mikä on mahdollista ja 
millaisissa olosuhteissa sekä millaisia syy-seuraus- ja muita riippuvuus- 
suhteita ilmiöiden välillä voidaan havaita. Voidaankin sanoa, että kes- 
keisen osan kontaktitutkijan metodologisesta osaamisesta muodostaa 
tutkimuskirjallisuuteen perehtyminen laajasti ja ennakkoluulottomasti, 
ja aloittaa voi esimerkiksi tämän artikkelin kirjallisuusluettelosta. 
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Mika? 

Dokumentoiva kielitiede pyrkii aiemmin tutkimattomien tai vähän tut- 
kittujen kielten monipuoliseen ja -muotoiseen tallentamiseen. Doku- 
mentoiva kielitiede on noussut tarpeesta tallentaa maailman kielellistä 
perintöä ja tukea uhanalaisten kielten puhujia kieltensä säilyttämisessä. 
Keskeisessä roolissa on primaarinen aineisto, tyypillisesti kenttätyössä 
kerättävät puhetallenteet, joista kootaan aineisto pysyväissäilytystä ja 
myöhempää käyttöä varten. Dokumentaatioon liittyy usein myös kielen 
kieliopin kuvaaminen ja referenssikieliopin laatiminen dokumentoitavas- 
ta kielestä kerätyn aineiston pohjalta. 


Katso myös: 
Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 


Luku 5 Lingvistinen etnografia toimintayhteisöissä 
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Luku 7 Laadullinen aineistopohjainen kielentutkimus 
Luku 14 Kielitypologian menetelmat 


Luku 16 Antropologinen lingvistiikka 


1. Johdanto 


Maailmassa puhutaan noin 7 ooo kieltä, joista vain murto-osa on ku- 
vattu kattavasti (Simons & Fennig 2018). Suurta osaa maailman kie- 
listä ei ole koskaan nauhoitettu, eikä niitä ole tallennettu kirjalliseen 
muotoon. Kielet ja niiden puhujamäärät ovat jakautuneet hyvin epä- 
tasaisesti: vuosituhannen vaihteessa maailman kielistä 96:ta prosenttia 
puhui ensikielenään vain neljä prosenttia maapallon väestöstä" (Crystal 
2000, 14). The Ethnologuen vuoden 2018 painoksen mukaan lähes puo- 
let maailman väestöstä puhuu ensikielenään jotakin maailman kym- 
menestä suurimmasta kielestä: mandariinikiinaa, espanjaa, englantia, 
arabiaa jne. (Simons & Fennig 2018). Monet kielet ovat vaarassa kadota 
ennen kuin niitä on tallennettu ja kuvattu tulevia sukupolvia ja maail- 
man kulttuuriperinnön säilyttämistä varten. On arvioitu, että jopa 90 
prosenttia maailman kielistä uhkaa kadota tämän vuosisadan loppuun 
mennessä (Bradley & Bradley 2002, xi). Lingvistiikan keskiöön onkin 
viimeistään 2000-luvulla noussut vahvasti dokumentoiva kielitiede, jon- 
ka pyrkimyksenä on koota ja tallentaa edustavia ja eettisesti ja teknisesti 
kestäviä aineistoja maailman kielistä (esim. Himmelmann 1998; 2006). 

Dokumentoivan kielitieteen voidaan katsoa kuuluvan diversiteetti- 
lingvistiikkaan, jonka keskiössä on maailman kielellisen monimuo- 
toisuuden kartoittaminen sekä kielten yhtäläisyyksien ja erojen tutki- 
mus. Suuntaus yhdistää vähän tutkittujen kielten kuvaamista, kielten 
typologista vertailua sekä usein myös kielten historiallisten kehitys- 
kulkujen vertailua. Dokumentoivan kielitieteen perustana on kieli- 
tieteellinen kenttätyö, johon kuuluu aineiston kerääminen kielestä sen 
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luonnollisessa käyttöympäristössä vuorovaikutuksessa kielen puhujien 
kanssa, yhä useammin myös uhanalaisten kielten revitalisaation tarpei- 
siin (Austin & Sallabank 2018). Kielitieteellisen kenttätyön lähtökohdat 
ovat 1800-luvulta alkaen harjoitetussa antropologisessa lingvistiikassa 
(ks. Antropologinen lingvistiikka tässä kirjassa). Kenttätyön historiaan 


kytkeytyvät vahvasti amerikkalainen strukturalismi ja Pohjois-Amerikan 
lukuisten alkuperäiskielten kuvaaminen 1900-luvun alussa, toisaalta 
Suomessa taas fennougristinen kenttätyö ja materiaalien kerääminen 
suomen sukukielten kuvaamiseksi erityisesti 1800-luvun puolivälissä 
ja 1900-luvun alkuvuosina (ks. esim. Grünthal 2010; Saarinen 2007). 

Dokumentoivan lingvistiikan tutkimusperinne rakentuu sellaisen 
kielikäsityksen varaan, jossa kieli nähdään osana puhujien henkistä, fyy- 
sistä, sosiaalista ja kulttuurista ympäristöä. Katoavien kielten ja kulttuu- 
rien dokumentointiin on kuulunut jo varhain sekä kielitieteellisen että 
etnografisen materiaalin keruu. Tutkimustiedon lisääntyessä on alettu 
ymmärtää yhä paremmin, millaiset monimutkaiset sosiokulttuuriset 
asetelmat määrittävät kielten ja niiden ympäristön suhdetta. Tarkastel- 
taessa kielen rakenteen, variaation ja muutoksen taustalla erottamatto- 
masti vaikuttavia kulttuurisia, demografisia, taloudellisia ja poliittisia 
suhteita on puhuttu myös kielen ekologiasta (Haugen 1971). 2000-lu- 
vun kielentutkimuksessa on usein erotettu toisistaan deskriptiivinen 
kielitiede (engl. descriptive linguistics) ja dokumentoiva kielitiede (engl. 
documentary linguistics), joiden tutkimustehtävät ovat osittain erilaiset 
(Himmelmann 1998). Deskriptiivisessä kielitieteessä pääpaino on en- 
nen kaikkea kieliopin kuvauksessa, kun taas dokumentoiva kielitiede 
keskittyy mahdollisimman laajojen ja monipuolisten kieliaineistojen 
keräämiseen ja julkaisemiseen tutkijoiden ja kieliyhteisön käyttöön. Kie- 
len dokumentointiprojekti on parhaimmillaan usean tutkijan yhteistyö, 
joka tuottaa laajoja digitaalisia ääni- ja videokorpuksia sekä niiden teksti- 
muotoisia esityksiä käännöksineen ja analyyseineen, eikä aineistojen 
pohjalta välttämättä kirjoiteta kielioppia. 

Tässä artikkelissa tarkastelumme kohteena on kenttätyö, jonka ta- 
voitteena on jonkin aiemmin tutkimattoman tai vähän tutkitun kielen 
dokumentoiminen kieliopin kokonaiskuvauksen eli referenssikieliopin 
kirjoittamista ja kielennäytteiden kokoamista varten. Tarkastelemme 
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kielten dokumentointiin ja aineiston keräämiseen liittyvää metodologiaa 
sekä referenssikieliopin kirjoittamisen periaatteita ja käytänteitä. Uhan- 
alaisten kielten dokumentointiin liittyy kiinteästi ajatus kielellisen moni- 
muotoisuuden tallentamisesta ja säilyttämisestä, jolloin korostuu äidin- 
kielisten puhujien osuus paitsi kenttätyöaineiston tuottamisessa myös 
sen jatkokäytössä kielen revitalisoinnin ja voimauttamisen näkökulmas- 
ta. Tutkijan kannalta taas kauemmas ja vieraaseen ympäristöön suun- 
tautuva kenttätyömatka vaatii erityisen tarkkaa käytännön suunnittelua 
ja esivalmistelua. Kohteesta ja aihepiiristä riippumatta kaikenlainen 
kenttätyö sisältää aina suunnitteluvaiheen, varsinaisen aineistonkeruun 
sekä materiaalin koostamisen aineistoksi ja julkaisuiksi. Seuraavalla ku- 
valla havainnollistamme, että kenttätyöhankkeen ydin, itse kentällä ta- 
pahtuva työskentely, on vain yksi osa kielen dokumentointiin tai kenttä- 
työpohjaiseen tutkimukseen liittyvää hanketta. 


Suunnittelu » Kenttätyö > Aineiston koostaminen ja annotointi 


m 
Aineiston | Kieliopin | Muut julkaisut 


arkistointi | kirjoittaminen 


Ez lo P 


Tutkitulle yhteisólle palauttaminen 5 Aineiston 


jatkokäyttö 


L iu J 


Kaavio 1. Kielen dokumentaatiohankkeen vaiheet. 


Antaaksemme lukijalle kuvan siitä, mihin kenttätyöllä tähdätään ja 
millaisia sisältöjä kenttätyöskentelyssä tutkitaan, kerromme tässä ar- 
tikkelissa ensin yhdestä kielenkuvaushankkeen tyypillisestä tuloksesta, 
referenssikieliopista, ja sen tavoitteista, sisällöstä ja rakenteesta (luku 
2). Kieliopin kuvaamisesta palaamme kentälle, kuvausta edeltävään ai- 
neistonkeruuvaiheeseen. Tutkimustarkoitusta vastaavan, monipuolisesti 
jatkokäytettävän ja tutkimuseettisesti kestävän kenttäaineiston kokoami- 
nen vaatii huolellista työskentelyä paitsi kielenpuhujien parissa myös 
ennen kenttämatkalle lähtemistä sekä varsinaisen kenttätyön jälkeen. 
Luvussa 3 pohdimme kenttätyön etukäteissuunnittelua, ja luvussa 4 
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pääsemme varsinaisten kenttätyössä käytettävien aineistonkeruume- 
todien pariin. Luvussa 5 käsittelemme kenttämateriaalin työstämistä 
aineistoksi monipuolisen jatkokäytön näkökulmasta. Luku 6 on lyhyt 
yhteenveto. 


2. Kenttätyöhön perustuva kieliopin 
kuvaaminen 


Kielitieteellisen kenttätyön päämääränä on usein kokonaiskuvauksen 
laatiminen tutkittavan kielen kieliopista eli referenssikielioppi. Se on 
kattava yleiskuvaus kuvattavan kielen kaikista keskeisistä osa-alueista, 
kieliopillisista rakenteista ja niiden kommunikatiivisista funktioista 
esimerkkilausein havainnollistettuna. Lisäksi kieliopin kuvaukseen si- 
sältyy tietoa puhujien fyysisestä ja sosiokulttuurisesta ympäristöstä ja 
näiden suhteesta tutkittavaan kieleen sekä kielennäytteitä, kuten ottei- 
ta tallennetuista teksteistä. Referenssikieliopin kirjoittamista voidaan 
monessa mielessä pitää vähän kuvatun kielen tutkimuksen perustana. 
Kokonaiskuvaus tutkittavasta kielestä antaa hyvän pohjan yksittäisten 
kieliopin ilmiöiden syvälliselle tarkastelulle. Riittävän laaja, laadukas ja 
monipuolinen kielioppi voi toimia myös kielenhuollon tukena yhteis- 
kunnan tarpeita varten. Tässä luvussa tarkastelemme kuitenkin ennen 
kaikkea kieliopin kirjoittamista tutkimuskäyttöä ja kielen ominaisuuk- 
sien tallentamista ajatellen. 


2.1. Referenssikielioppi — mikä ja miksi? 


Kielioppeja voidaan kirjoittaa hyvin monia erilaisia käyttötarkoituksia 
varten, esimerkiksi opetus- ja opiskelu- tai tutkimuskäyttöön, kielen nor- 
mittamista ajatellen tai kielen ominaisuuksien tallentamiseksi osana 
maailman kulttuuriperintöä. Käyttötarkoituksesta ja kohdeyleisöstä riip- 
puu, kuinka laaja kieliopista tehdään ja miten sen sisältö jäsennellään. 
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Referenssikielioppi on luonteeltaan ennen kaikkea hakuteos, josta lu- 
kija voi halutessaan löytää tietoa jostakin tutkittavan kielen kieliopilli- 
sesta ilmiöstä, kuten demonstratiiveista, aspektista tai passiivilauseista. 
Referenssikieliopeista ovat kiinnostuneita monenlaisista eri taustoista 
tulevat tutkijat, esimerkiksi eri kielikuntien asiantuntijat, kielitypologit, 
historiallisen kielitieteen, kielikontaktien ja areaalilingvistiikan tutkijat 
sekä kielioppiteorioiden laatijat mutta myös historioitsijat, kulttuurin- 
tutkijat ja yhteiskuntatieteilijät. Joissakin tapauksissa myös itse kieli- 
yhteisö voi hyödyntää referenssikielioppia esimerkiksi kielenhuollon, 
kirjoitusjärjestelmän kehittämisen tai koulutuksen suunnittelun apuna. 
Referenssikielioppien olisi siis sovittava laajalle lukijakunnalle. Lisäksi 
referenssikielioppeja käytetään usein hyvinkin pitkien aikojen kuluttua 
niiden laatimisesta. Jos tutkittava kieli on hyvin uhanalainen, referenssi- 
kielioppi saattaa jäädä ainoaksi lähteeksi, joka siitä on tulevaisuudessa 
käytettävissä. 

Ihannetapauksessa kielioppi palvelee sekä tutkijoita että kieliyhtei- 
söä, mutta molempien kohdeyleisöjen puhutteleminen samassa teok- 
sessa voi olla haastavaa jo esimerkiksi terminologisten ja ortografisten 
valintojen vuoksi. Ratkaisuna voisi olla, että kieliopin kirjoittaja laatii 
sekä tutkijayhteisölle suunnatun kieliopin että kieliyhteisölle suunnat- 
tua materiaalia (kielioppi, tekstikokoelmia, sanakirja). Hyvä tutkimu- 
setiikka edellyttää, että tutkimuksessa käytetyt aineistot palautetaan 
kieliyhteisölle sellaisessa muodossa, että yhteisö voi niitä hyödyntää. 
Referenssikieliopin kirjoittamisen lisäksi kielen dokumentointiin kuu- 
luu erottamattomasti sanaston kerääminen sekä kielennäytteiden julkai- 
seminen teksteinä ja nauhoitteina. Referenssikielioppi, sanakirja ja teks- 
tikokoelma ovat kielenkuvauksen kolme kulmakiveä; näitä nimitetään 
usein boasilaiseksi trilogiaksi amerikkalaisen strukturalistin Franz Boasin 
mukaan, joka omassa työssään pyrki edistämään kaikkien näiden kol- 
men osa-alueen ottamista mukaan kielenkuvaukseen (Evans & Dench 
2006, 10). Myös nykyään kielten dokumentointiin tulisi ihannetapauk- 
sessa kuulua niin kieliopin kuvausta, sanastotyötä kuin kieliaineisto- 
jen julkaisemistakin. Laajemman dokumentaatioprojektin yhteydessä 
voidaan tuottaa erilaisia digitaalisia ääni-, video- ja tekstimateriaaleja 
ja kielenainesten analyysia yhdistäviä verkkoaineistoja ja -sanakirjoja. 
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Kuitenkaan kaikissa hankkeissa ei käytännön syistä ole mahdollista kes- 
kittyä kaikkiin kielten dokumentoinnin osa-alueisiin yhtä syvällisesti. 
Koska referenssikielioppien lukijakunta on laaja ja kielioppeja käy- 
tetään usein pitkienkin aikojen kuluttua niiden laatimisesta, niiden 
kirjoittamisessa olisi mahdollisuuksien mukaan pyrittävä esitystapaan, 
joka on helposti lähestyttävä monenlaisista taustoista tuleville tutkijoil- 
le. Tämän vuoksi referenssikielioppien laatimisessa ei nykyään yleensä 
käytetä kovin abstrakteja teoreettisia kielioppimalleja, jotka ovat ymmär- 
rettäviä vain asiaan perehtyneille tutkijoille ja joihin perustuvat esitykset 
vanhenevat helposti teorioiden kehittyessä. Sen sijaan niiden laatimi- 
sessa käytetään verrattain epämuodollista, deskriptiivistä teoriakehystä, 
jota kutsutaan peruskielioppiteoriaksi (engl. Basic Linguistic Theory, BLT) 
(Dixon 2010; Dryer 2006; ks. myös Antropologinen lingvistiikka tk.). 


Peruskielioppiteoria on saanut paljon vaikutteita kielitypologiasta, ja 
se sisältää useimpien kielioppiteorioiden jakamia, osin myös koulujen 
kieltenopetuksen perusteella ymmärrettäviä kieliopillisia käsitteitä, ku- 
ten subjekti, adjektiivi, postpositio ja sijamuoto. 

Kieliopin kirjoittajalla on ohjenuoranaan aina aineistolähtöisyys ja 
kielen kuvaaminen mahdollisimman luonnollisessa käyttökontekstis- 
saan. Aineistona suositaan tekstejä ja keskusteluja, ja niistä esiin nou- 
sevien ilmiöiden perusteella tehdään yleistyksiä kieliopillisesta järjes- 
telmästä. Kieliopin kuvaamisessa tehdyt ratkaisut on aina perusteltava 
suhteessa käytettyyn aineistoon; jokaisesta kieliopissa kuvatusta ilmiöstä 
on annettava runsaasti aineistoesimerkkejä. 

Referenssikielioppien laatimisella on erityisen läheinen suhde kieli- 
typologiaan. Kielitypologit käyttävät aineistonaan enimmäkseen refe- 
renssikielioppeja, ja toisaalta taas kielitypologien tuottama tieto siitä, 
mikä maailman kielissä on mahdollista, tavallista tai epätavallista, aut- 
taa yksittäiskielen tutkijaa kieliopin laatimisessa. Referenssikieliopeissa 
kuvataan usein sellaisia kieliä, joilla ei ole vahvaa tutkimustraditiota ja 
vakiintunutta kielioppiterminologiaa. Kuvausmallin laatimisessa hyö- 
dynnetään silloin kielitypologien tekemiä yleistyksiä maailman kielis- 
tä. Tällaista tietoa voisi olla esimerkiksi se, mitä sanaluokkia maailman 
kielistä on löydetty ja miten eri sanaluokat tyypillisesti taipuvat. Useim- 
missa kielissä tehdään esimerkiksi ero substantiivien ja verbien välillä, 
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joten on todennäköistä, että tämä ero tehdään jollakin tavalla myös tut- 
kittavassa kielessä. Kielitypologisen tutkimuksen pohjalta on laadittu 
erilaisia oppaita ja "tarkistuslistoja" kenttätyön ja kieliopin kirjoittami- 
sen avuksi (Comrie & Smith 1977; Shopen 1985; 2007; Payne 1997). 
On kuitenkin tärkeää huomioida, että vaikka typologinen tieto on kieli- 
opin kuvauksessa tärkeää, referenssikieliopin kirjoittamisen päämää- 
ränä on aina tutkittavan kielen kuvaaminen sen omista lähtökohdista 
käsin. Maailman kieliä koskevien yleistysten, teorioiden tai kielioppien 
kirjoitusoppaiden ei pidä antaa ohjata työskentelyä liikaa. Esimerkiksi 
englannin kieliopin kuvauksessa kieliopillinen subjekti on erittäin tär- 
keä kategoria, kun taas mandariinikiinassa suuri osa lauserakenteista on 
luonteeltaan topiikki-kommenttirakenteita ja subjekti ei ole yhtä tärkeä 
kieliopillinen kategoria kuin monissa muissa kielissä. Mandariinikiinan 
kieliopin kirjoitustyössä painotetaan tällöin topiikkirakenteiden kuvaus- 
ta, eikä lauseissa oleteta automaattisesti olevan subjekteja ainoastaan 
sillä perusteella, että subjekti on maailman kielissä yleinen kieliopillinen 
kategoria (ks. Li & Thompson 1981). 

Kieliopin kuvauksessa keskitytään niihin rakenteisiin ja ilmiöihin, 
jotka ovat oleellisia juuri tutkittavassa kielessä. Typologinen tieto aut- 
taa yksittäiskielen tutkijaa ennen kaikkea kysymyksenasettelussa sekä 
kenttätyön ja kieliopin rakenteen suunnittelussa (Sandman 2013, 56). 
Lisäksi typologisen tiedon avulla tutkittavan kielen ilmiöt voidaan aset- 
taa laajempaan viitekehykseen; mikä tutkittavassa kielessä on erityisen 
poikkeuksellista ja kiinnostavaa kieltenvälisestä näkökulmasta. Esi- 
merkiksi monissa tiibetiläiskielissä on mahdollista ilmaista pakollisen 
verbimorfologian avulla, onko puhuja itse osallistunut tapahtumaan, 
josta kertoo, vai tarkasteleeko hän tapahtumaa ulkopuolisen roolissa 
(ks. San Rogue, Floyd & Norcliffe 2018, 2). Tällainen ns. egoforisuus- tai 
perspektiivikategoria on löydetty vain hyvin harvoista maailman kielis- 
tä, ja siksi se on typologisesta näkökulmasta erityisen mielenkiintoinen 
ilmiö, jota kannattaa tuoda tiibetiläiskielten referenssikieliopeissa esiin 
(ks. myös luku 2.2.). Toisaalta taas kielitypologien pääasiallista aineistoa 
ovat referenssikieliopit; koska typologisen tutkimuksen aineistot ovat 
laajoja ja käsittävät yleensä useita satoja kieliä, typologi ei voi osata tut- 
kimiaan kieliä itse vaan on riippuvainen muiden tutkijoiden laatimista 
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kielenkuvauksista (ks. Kielitypologian menetelmät tk.). Referenssikieli- 


opit olisikin pyrittävä laatimaan niin, että niitä aineistona käyttävä typo- 
logi löytää helposti etsimänsä tiedon (ks. luku 2.3.). Hedelmällinen yh- 
teistyö yksittäisten kielten kieliopin kirjoittajien ja kielitypologien välillä 
hyödyttää molempia osapuolia. 

Sen lisäksi että kielioppien lukijakunta on laaja, on myös kielioppien 
kirjoittajissa monenlaisista taustoista tulevia tutkijoita opiskelijoista 
urallaan pitkälle ehtineisiin asiantuntijoihin. Referenssikieliopin laati- 
minen vähän kuvatusta kielestä on aina pitkäaikainen ja vaativa projekti, 
jossa tarvitaan monenlaisia tutkimustaitoja sekä lisäksi tietynlaista pitkä- 
jänteistä omistautumista tutkimustyötä kohtaan. Materiaalin keräämi- 
nen kentällä, kenttämateriaalien työstäminen tutkimusaineistoiksi ja 
kieliopin kirjoittaminen on työlästä ja aikaa vievää. Lisäksi tutkimuksen 
toteutukseen vaikuttavat lukuisat kenttätyöolosuhteisiin liittyvät tekijät, 
joihin tutkija ei aina pysty itse vaikuttamaan. Kokonaisen vähän tutkitun 
kielen referenssikieliopin kirjoittaminen yksin väitöskirjatyönä on mah- 
dollista, ja tällaisia väitöskirjoja on tehty jonkin verran mm. Helsingin 
yliopistossa (ks. Wilde 2008; Berghäll 2010; Sippola 2012; Killian 2015; 
Sandman 2016; Honkasalo 2019; Yliniemi 2019). Myös maisterin- 
tutkinnon puitteissa on mahdollista aloittaa kieliopin kirjoittaminen, 
tutkia jotakin kieliopin osa-aluetta kenttätyön avulla tai vaikkapa laatia 
kielioppiluonnos jostakin vähän kuvatusta kielestä, mutta kenttätyöhön 
perustuva opinnäytetyö vaatii aina erityisen huolellista suunnittelua ja 
paljon tukea ja ohjausta. Olisi myös erittäin toivottavaa, että yksin puur- 
tamisen sijaan kieliopin kuvausta ja kielten dokumentointia tehtäisiin 
tulevaisuudessa entistä enemmän tutkimusryhmissä. Ryhmissä työsken- 
tely mahdollistaa tehtävien jakamisen, laajempien tutkimusaineistojen 
kokoamisen ja neuvojen saamisen kokeneemmilta tutkijoilta ja takaa 
siten paremmin myös tutkimuksen validiteetin. Jos kieliopin kuvaami- 
sessa suosittaisiin yksin työskentelyn sijaan enemmän ryhmätyösken- 
telyä, myös kenttätyöhön perustuvien opinnäytetöiden tekeminen olisi 
jatkossa helpompaa. Myös kenttätyömetodiikan opetuksen lisääminen 
yliopistoissa sekä opettajien ja opiskelijoiden yhteiset kenttäretket ovat 
hyvä tapa parantaa tulevien tutkijoiden valmiuksia kenttätyöhön perus- 
tuvaan kieliopin kuvaukseen. Parhaimmillaan kenttätyöhön perustuva 
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kielten dokumentointi ja kieliopin kuvaus on erittäin antoisaa ja palkit- 
sevaa työtä, jonka tieteellinen ja yhteiskunnallinen merkitys on suuri. 


2.2. Kieliopin rakenne ja osa-alueet 


Koska eri kielten kieliopillisissa rakenteissa on huomattavia eroja, myös 
referenssikielioppien rakenteessa tehdyt ratkaisut vaihtelevat. Paitsi tutkit- 
tava kieli ja kieliopin kohdeyleisö myös tutkijan oma tausta ja henkilökoh- 
taiset mieltymykset vaikuttavat kieliopin kirjoittamiseen. Kieliopin kirjoitta- 
minen on aina ainutkertainen prosessi. Kieliopin kirjoittaja voi esimerkiksi 
joutua valikoimaan tai kehittelemään uutta terminologiaa harvinaisille il- 
miöille, joille ei ole vakiintuneita nimityksiä typologisessa tutkimuksessa. 
Toisaalta referenssikielioppien jäsentelyssä voidaan hahmottaa myös ylei- 
siä periaatteita, joita käsittelemme tässä artikkelissa. Tieto referenssikieli- 
oppien tyypillisestä rakenteesta auttaa niin aloittelevaa kieliopin kirjoittajaa 
työn suunnittelussa kuin kieliopin lukijaa kieliopin laadun arvioinnissa, 
mutta kieliopin kirjoittaja joutuu aina erikseen miettimään myös niiden 
ilmiöiden kuvausta, jotka eivät sovi olemassa oleviin malleihin. 

On tärkeää pitää mielessä, että referenssikielioppi on aina kokonai- 
suus, jossa täytyy käsitellä kaikki kieliopin keskeiset osa-alueet. Kieliopin 
kirjoittaja ei voi sivuuttaa sellaisiakaan kielenkuvauksen osa-alueita, joi- 
den kuvaaminen on erityisen vaikeaa tai joita koskeva tieto on riittämä- 
töntä. Kielioppi, joka ei käsittele lainkaan vaikkapa intransitiivilauseita 
tai negaatiota, on epätäydellinen. Verrattain suppeakin referenssikieli- 
oppi on aina laaja teos, pituudeltaan 300-400 sivua tai enemmän. Jos 
laajamittainen kenttätyö ja kokonaisen kieliopin kirjoittaminen ei jos- 
tain syystä ole mahdollista, voidaan tutkittavasta kielestä laatia myös 
lyhempi kuvaus, kielioppiluonnos (engl. grammar sketch). Kielioppi- 
luonnoksen pituus on yleensä joitakin kymmeniä sivuja. Sen rakenne 
on periaatteessa samankaltainen kuin referenssikieliopin, mutta se on 
paljon suppeampi esitys tutkittavasta kielestä ja antaa vain perustiedot ja 
joitakin esimerkkejä käsiteltävistä aihepiireistä?. Tällainen kielenkuvaus 
antaa tutkittavasta kielestä vain pintapuoliset tiedot mutta voi toimia 
hyvänä pohjana laajemmalle tutkimukselle. 
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Seuraavassa on lueteltu kielenkuvauksen keskeisimpia osa-alueita, 
joihin referenssikieliopeissa usein otetaan kantaa. Nämä voivat joko olla 
omina lukuinaan kieliopissa tai niitä voidaan yhdistellä toisiinsa tai jakaa 
alalukuihin. Kaikissa kielissä on äänteitä ja monenlaisia muotokatego- 
rioita, sanat jakautuvat yleensä sanaluokkiin, sanoista voidaan muodos- 
taa lauseita ja lauseita yhdistellään laajemmiksi kokonaisuuksiksi. Siksi 
näihin asioihin otetaan yleensä kieliopissa kantaa, jotta kielenkuvaus 
olisi kattava ja vertailukelpoinen muiden kielenkuvausten kanssa. Kui- 
tenkin kielissä on suuria eroja sen välillä, kuinka paljon ja millaisia 
äänteitä esiintyy, miten muotokategorioita käytetään, mitä sanaluokkia 
siinä mahdollisesti on ja miten ne taipuvat ja millaisiin tyyppeihin lau- 
seet voidaan jakaa. Näiden yksityiskohtien esittäminen eroaa myös eri 
kielten kieliopeissa suuresti, ja modernin funktionaalisen kielitieteen 
lähtökohtana on aina tuoda esiin juuri tutkittavalle kielelle ominaiset il- 
miöt. Tästä syystä alla esitettyä tulee pitää vain suuntaa antavana mallina 
referenssikieliopeissa usein käsitellyistä asioista, ei varsinaisena kieli- 
opin dispositioehdotuksena, joka olisi sellaisenaan sovellettavissa minkä 
tahansa kielen kuvaukseen. Kieliopeissa tehdyt ratkaisut nousevat aina 
tutkijan omassa aineistossaan havaitsemista säännönmukaisuuksista. 

Referenssikieliopit aloitetaan yleensä johdannolla. Johdannossa 
kerrotaan perustiedot tutkittavasta kielestä ja tutkimuksen taustasta. 
Perustietoja ovat tutkittavan kielen maantieteellinen, genealoginen ja 
kielisosiologinen konteksti: Missä tutkittavaa kieltä puhutaan, mihin 
kielikuntaan se kuuluu ja millainen on sen puhuma-alueen kielellinen 
tilanne? Mitä kieliä tutkittavan kielen puhujat osaavat, miten he käyttä- 
vät eri kieliä arkielämässään ja millainen on tutkittavan kielen asema 
yhteisössä? Mitä nimityksiä tutkittavasta kielestä ja sen puhujista käyte- 
tään? Kokevatko kielen puhujat kuuluvansa johonkin etniseen ryhmään? 
Monissa maissa on käytössä myös jonkinlainen virallinen etnisten ryh- 
mien luettelo (esim. Kiinassa on 55 virallisesti tunnustettua kansallista 
vähemmistöä), joka voi olla enemmän tai vähemmän keinotekoisesti 
määritelty eikä vastaa kieliyhteisöjen omaa identiteettiä. Johdantoluvus- 
sa esitellään lyhyesti myös alueen historiaan sekä kieliyhteisön kulttuu- 
riin, kuten elinkeinoihin, tapakulttuuriin ja uskontoihin, liittyviä kysy- 
myksiä. Tämä osuus referenssikielioppien johdannossa on pakostakin 
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yksinkertaistettu esitys aiheesta, koska tutkimuksen pääpaino on kieli- 
opin kuvauksessa. 

Kielioppien johdantoluvuissa esitetään yleensä myös lyhyt ja tiivis 
läpileikkaus tutkittavan kielen kieliopista ja sille ominaisista typologi- 
sista piirteistä: perussanajärjestys, morfologinen typologia, pääsanan ja 
määritteiden merkintä (ns. head/dependent-marking), kiinnostavimmat 
kieliopilliset kategoriat jne. Kielisosiologisen ja typologisen taustatiedon 
lisäksi johdantoon kuuluu tutkimuksen teoreettinen tausta, joka moder- 
neissa referenssikieliopeissa on useimmiten peruskielioppiteoria. Kieli- 
opin kirjoittaja kertoo lisäksi johdannossa tutkittavaa kieltä koskevasta 
aikaisemmasta tutkimuksesta, omasta kenttätyöstään ja sen taustasta: 
Millaista tutkimusta kyseisestä kielestä on aiemmin tehty ja miten re- 
ferenssikielioppi suhteutuu siihen? Milloin ja kuinka pitkään kieliopin 
kirjoittaja on tehnyt kenttätyötä tutkittavan kielen puhujien parissa ja 
millaisia kielenoppaita hänellä on ollut apunaan? Millainen on kielen- 
oppaiden asema yhteisössä? Kuinka laaja kieliopin pohjana käytetty ai- 
neisto on (esim. kuinka monta tuntia puhetta on nauhoitettu, kuinka 
monta transkriboitua lausetta kieliopin aineisto sisältää) ja millaista 
aineistoa on kerätty, mukaan lukien esim. kertomukset, keskustelu- 
aineisto, elisitoidut lauseet ja stimulusten käyttöön perustuva aineisto 
(ks. myös luku 4)? 

Useimmissa kieliopeissa käsitellään johdannon jälkeen äänneoppia 
eli fonologiaa, esimerkiksi millainen on tutkittavan kielen äännejärjes- 
telmä, missä asemissa äänteet esiintyvät, millaista allofonista vaihtelua 
esiintyy, millainen on tavurakenne ja millainen rooli on prosodialla. Toi- 
nen tärkeä kielenkuvauksen osa-alue on muotokeinot: millaisia muoto- 
keinoja tutkittava kieli käyttää (esim. affiksaatio, reduplikaatio, sisäinen 
muunnos) ja millaista morfofonologista vaihtelua esiintyy. 

Oleellinen asia minkä tahansa kielen kieliopin kuvauksessa ovat 
sanaluokat: Mitä sanaluokkia kielessä on (tai onko sanaluokkien mää- 
rittely ylipäätään mahdollista) ja millaisin kriteerein sanaluokat voidaan 
erottaa toisistaan? Löytyykö eri sanaluokista niille tyypillisiä muoto- 
kategorioita? Sanaluokat ovat aina mitä suurimmassa määrin kielikoh- 
taisia. Osassa maailman kieliä ei ole esimerkiksi adjektiiveja yhtenä 
erillisenä sanaluokkana. Esimerkiksi suomen etäsukukieliin kuuluvassa 
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tundranenetsissä ominaisuutta ilmaisevat sanat jakaantuvat kahteen 
sanaluokkaan ja taipuvat joko kuten nominit tai kuten verbit: esimer- 
kiksi 'musta' on verbi ja 'valkoinen' nomini? (Jalava 2013). Toisaalta taas 
monissa Papuan ja Australian kielissä vaikkapa sukulaisuustermit ovat 
oma sanaluokkansa (esimerkki papualaisen oksapminin kielen sana- 
luokista ks. Loughnane 2010). Kieliopin kirjoittajan on pohdittava, mil- 
lainen sanaluokkajako kielessä on ja kuinka monta käsittelylukua sana- 
luokkien kuvaamiseen tarvitaan. Kielitypologisen tutkimuksen valossa 
sanaluokista universaaleimmat ovat substantiivi ja verbi (Payne 1997, 33). 
Niiden välinen ero voidaan tehdä useimmissa tunnetuissa kielissä, ja sik- 
si moniin referenssikielioppeihin sisältyvät luvut substantiivilausekkeen 
ja verbilausekkeen rakenteesta. On kuitenkin kieliä, joissa sanaluokkien 
erottaminen toisistaan saattaa olla hyvinkin ongelmallista ja edes subs- 
tantiivin ja verbin välinen ero ei ole selkeä. Tällaisia kieliä ovat etenkin 
rakenteeltaan hyvin analyyttiset kielet, joissa on vain niukasti tai ei ol- 
lenkaan taivutusmorfologiaa. Ääriesimerkki hyvin analyyttisestä kielestä 
on riaunindonesia, jossa substantiiveille ja verbeille ominaisten muoto- 
kategorioiden erottaminen on lähes mahdotonta (ks. Gil 2001, 118-119). 

Sananlaajuisten yksikköjen lisäksi kieliopeissa käsitellään tyypillisesti 
lauseita: millainen on tutkittavan kielen perussanajärjestys, millainen 
on väitelauseen rakenne, mitä muita lausetyyppejä kuin väitelauseita 
esiintyy (esim. kysymykset, käskyt) sekä millaisin keinoin lauseita yhdis- 
tetään? Lauseoppia ei aina ole mahdollista käsitellä yksityiskohtaisesti, 
mikäli tutkittava kieli on erittäin uhanalainen eivätkä puhujat käytä sitä 
aktiivisesti arkielämässään. Tällöin ainoaksi aineistonkeruumenetelmäk- 
si saattaa jäädä yksittäisten sanojen ja hyvin yksinkertaisten lauseiden 
kysyminen suoraan puhujilta, ja aineiston suppeus näkyy myös valmiis- 
sa kieliopissa, josta jäävät tällöin puuttumaan ainakin monimutkaisem- 
mat lauserakenteet. 

Muodollisten kategorioiden, kuten sanojen ja lauseiden, lisäksi mo- 
derneissa referenssikieliopeissa käsitellään omina lukuinaan runsaas- 
ti myös monenlaisia kieliopillisia merkityksiä ja funktioita, kuten va- 
lenssin, aikamuotojen, aspektin, topiikkirakenteiden ym. ilmaisemista. 
Muodon ja merkityksen roolia kieliopin kuvauksessa käsitellään tarkem- 
min luvussa 2.3. 


608 LOTTA JALAVA JA ERIKA SANDMAN 


Kielioppeihin kuuluu lisäksi lähdeluettelo, tekstinäytteitä eri teksti- 
lajeja edustavista teksteistä sekä mahdollisesti hakemisto kieliopissa 
käytetyistä asiasanoista. Viimeksi mainittua ei monissa referenssikieli- 


opeissa ole, mutta hakemiston laatiminen auttaa lukijaa löytämään ha- 
luamansa tiedon. 


2.3. Muotolähtöisyys sekä merkitys- ja funktiolähtöisyys 


kieliopin kuvauksessa 


Kaksi referenssikieliopin esimerkkidispositiota 


Dispositio 1 (muotolähtöinen, perustuu löyhästi Wilden [2008] 


kielioppiin). 


Ue 


W ON AY sw v 


cy c5 
EO 


Johdanto 
Aanneoppi 
Muoto-oppi 
Substantiivilauseke 
Verbilauseke 
Adjektiivit 
Adverbit 

Muut sanaluokat 
Lauserakenne 


. Yhdyslauseet 
. Tekstinäytteitä 


Dispositio 2 (enemmän merkitys- ja funktiolähtöinen, perustuu löyhästi 


Eppsin [2008] kielioppiin). 


Us 


ay kw N 


Johdanto 

Aanneoppi 

Sanaluokat 
Nominimorfologia 
Verbimorfologia 
Argumenttien merkinta 
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7. Aspekti 

8. Modaalisuus ja evidentiaalisuus 
9. Lauserakenne 

10. Negaatio 

11. Kysymykset 

12. Yhdyslauseet 

13. Tekstinäytteitä 


Kielioppien sisällön jäsentely voi perustua toisaalta muotoon ja toisaal- 
ta merkitykseen ja kieliopilliseen funktioon. Muotokeinojen, sanaluok- 
kien ja lauserakenteiden kuvaaminen omissa luvuissaan on esimerkki 
muotolähtöisestä lähestymistavasta, jolle on tyypillistä kuvauksen jäsen- 
tely esimerkiksi morfologian ja taivutusparadigmojen mukaan. Useim- 
missa kieliopeissa on ainakin joitakin lukuja, joissa lähtökohtana on 
muoto, esimerkiksi sija- tai persoonataivutus. Näiden lisäksi modernissa 
deskriptiivisessä kielitieteessä painotetaan kuitenkin vahvasti myös mer- 
kitys- ja funktiolähtöistä lähestymistapaa (ks. Ojutkangas, Larjavaara, 
Miestamo & Ylikoski 2009), jossa lähtökohtana on muodon sijaan jokin 
kielellinen funktio (esim. modaalisuus, aspekti, informaatiorakenne, 
deiksis jne.). Sen alla käsitellään erilaisia kieliopillisia rakenteita, joilla 
voidaan ilmaista kyseistä funktiota. Esimerkiksi modaalisuutta voidaan 
monissa kielissä ilmaista niin affikseilla, apuverbeillä kuin erillisillä 
partikkeleilla. Merkitys- ja funktiolähtöisessä lähestymistavassa näitä 
kaikkia käsitellään samassa luvussa, vaikka ne kieliopillisen muodon 
kannalta edustaisivatkin erilaisia rakenteita. Funktiolähtöistä kielioppia 
kirjoitettaessa pyritään korostamaan erityisesti sellaisia kieliopillisia il- 
miöitä, jotka ovat keskeisiä tutkittavassa kielessä tai kiinnostavia kielten- 
välisestä näkökulmasta. Jos tutkittavasta kielestä löytyy jokin ilmiö, jota 
on tutkittu kielitypologian piirissä vain vähän (vaikkapa harvinaisia 
tiedonlähteiden tyyppejä sisältävä evidentiaalisysteemi), se todennäköi- 
sesti kiinnostaa tutkijoita ja sitä kannattaa tuoda esiin. 

Useimmat kieliopit ovat rakenteeltaan yhdistelmä muoto- ja funktio- 
lähtöisiä lukuja. Kielioppi aloitetaan usein muutamalla muotolähtöisellä 
luvulla (esim. äänneoppi, sanaluokat) ja näiden jälkeen tulee painotuk- 
seltaan funktiolähtöisempiä lukuja (esim. valenssi, omistus, aspekti). Jos 
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tutkittavassa kielessä on paljon sanaluokkia, jotka voidaan selkeästi erot- 
taa toisistaan niille ominaisten muotokategorioiden perusteella, kielen- 
kuvaus on usein järkevää rakentaa sanaluokkien ja niille ominaisen 
morfologian ympärille. Tällaisia kieliä ovat monet indoeurooppalaiset 
kielet, kuten indoarjalainen räjbanshin kieli. Wilden (2008) räjbanshin 
kielioppi perustuu siksi pitkälti eri sanaluokkia (substantiivit, pronomi- 
nit, verbit, apuverbit, adjektiivit, partikkelit, konjunktiot) ja niille omi- 
naisia taivutuskategorioita käsitteleviin lukuihin. Toisaalta taas kieli- 
oppi on mahdollista perustaa hyvin pitkälti kieliopillisten merkitysten 
ja funktioiden kuvaamiseen, jolloin muotokategorioita käsittelevät luvut 
jäävät paljon vähäisempään rooliin (esimerkkeinä hyvin funktiolähtöi- 
sesti kirjoitetuista referenssikieliopeista ks. Frajzyngier 2002 Pohjois- 
Kamerunissa puhuttavasta hdin kielestä ja Epps 2008 Amazonin alueel- 
la puhuttavasta hupin kielestä). Edellä mainittu lähestymistapa toimii 
erityisen hyvin sellaisen kielen kuvaamiseen, jossa eri sanaluokille omi- 
naiset muotokategoriat ovat vähemmän selkeitä. 

Samaa kieliopillista rakennetta voidaan myös käsitellä eri luvuissa 
sekä muodon että merkityksen näkökulmista. Jos tutkittavassa kielessä 
on vaikkapa akkusatiivisijaa ilmaiseva pääte, sitä voidaan ensin käsitellä 
morfologisen rakenteen kannalta substantiivien muotokategorioita kä- 
sittelevässä luvussa ja sen merkityksiä ja funktioita objektin merkitsijä- 
nä voidaan myöhemmin käsitellä tarkemmin argumenttien merkintää 
käsittelevässä luvussa. 

Muoto- ja funktiolähtöinen esitystapa palvelevat osin erilaisten kohde- 
yleisöjen tarpeita. Esimerkiksi tarkasteltavan kielen lähisukukieliä tun- 
teva tutkija voi saada kielestä nopeammin kokonaiskuvan muotokatego- 
rioittain kuvatun kieliopin avulla. Valtavaa määrää eri kielten kielioppeja 
aineistonaan käyttävän kielitypologin näkökulmasta taas merkitykset ja 
funktiot ovat helpoin lähtökohta. Merkitys- ja funktiolähtöinen kieliopin 
kuvaustapa auttaa kieliopin käyttäjää löytämään haluamansa tiedon, 
koska samaa kieliopillista ilmiötä usein ilmaistaan monilla erilaisilla 
rakenteilla. Jos kiinnostuksen kohteena on vaikkapa modaalisuus, kau- 
saalisuus tai omistus, on tiedon hakeminen huomattavasti helpompaa, 
mikäli koko ilmiötä on käsitelty yhdessä merkityslähtöisessä luvussa ja 
käyttäjä saa sitä tarkastelemalla kokonaiskuvan aiheesta. 
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2.4. Kieliopin kuvaamisen problematiikkaa 


Kieliopin kuvauksessa kaikki liittyy kaikkeen eikä yksittäisiä ilmiöitä ole 
useinkaan mahdollista kuvata ottamatta samalla kantaa koko kielioppiin. 
Esimerkiksi sanaluokat voidaan määritellä vain suhteessa toisiinsa. Kun 
kuvataan substantiiveille ominaisia morfologisia ja syntaktisia piirteitä, 
otetaan samalla kantaa siihen, mikä erottaa substantiivit verbeistä, ja 
silloin on tiedettävä jotakin myös siitä, miten verbit kielessä toimivat. 
Koska kielioppi koostuu lukuisista toisiinsa liittyvien muotojen ja mer- 
kitysten alasysteemeistä, kieliopin kuvausta ei ole mahdollista kirjoittaa 
valmiiksi luku kerrallaan, vaan työ vaatii useiden lukujen työstämistä 
samanaikaisesti. Jo työn alussa on tärkeää pyrkiä hahmottamaan jon- 
kinlainen kokonaisrakenne kieliopista ja laatia alustava sisällysluettelo. 
Kieliopin rakenne muuttuu ja täydentyy vähitellen työskentelyn edis- 
tyessä, mutta alustava sisällysluettelo on välttämätön tutkimusaiheen 
kokonaisuuden hahmottamiseksi. Jotkin kieliopin osa-alueet ovat työn 
kokonaisrakenteen kannalta tärkeämpiä kuin toiset. Tällainen ilmiö on 
esimerkiksi sanaluokat (Munro 2006, 71). Jos minkä tahansa kielen 
sanaluokkajärjestelmä analysoidaan uudella tavalla kirjoitusprosessin 
kuluessa, tämä todennäköisesti aiheuttaa eriasteisia muutoksia kieliopin 
muihin lukuihin. Toisaalta joitakin kieliopin osa-alueita voi olla mah- 
dollista tarkastella erikseen ilman, että koko työn rakenne radikaalisti 
muuttuu. Jo kieliopin kuvauksen alkuvaiheessa olisi pyrittävä hahmotta- 
maan, millaisten ilmiöiden kuvaus vaikuttaa eniten kieliopin kokonais- 
rakenteeseen. Kieliopin kirjoittaja joutuu myös aina tekemään ratkaisuja 
kuvauksen kattavuuden ja tiiviin, käyttäjäystävällisen esitystavan välillä. 
Referenssikieliopin täytyy kuvata tutkittava kieli riittävän laaja-alaisesti 
ja syvällisesti, mutta samalla raja on vedettävä johonkin. Liian laaja ja 
loputtomia yksityiskohtia sisältävä kielioppi ei enää ole käyttäjäystävälli- 
nen eikä helppolukuinen. 

Kieliopin luettavuuteen voidaan vaikuttaa monilla kirjoitusteknisil- 
lä ratkaisuilla. Vaikka samoja asioita joudutaan monesti käsittelemään 
useissa kohdissa kielioppia, liiallista toistoa pyritään välttämään ja käy- 
tetään sen sijaan tekstin sisäisiä viitteitä, joiden avulla lukijaa ohjataan 
löytämään kaikki ne luvut, joissa käsiteltävä asia (esim. akkusatiivisija) 
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esiintyy. Myös lähdeluettelon ja kieliopin loppuun tulevan asiasanahake- 
miston avulla autetaan lukijaa löytämään haluamansa tieto kieliopista. 

Kieliopeissa pyritään käyttämään sellaista terminologiaa, joka on 
mahdollisimman hyvin tunnettua potentiaalisen kohdeyleisön keskuu- 
dessa; termivalinnat voivat tällöin olla hyvinkin erilaisia riippuen sii- 
tä, kirjoitetaanko ensisijaisesti tutkijoille vai kieliyhteisölle. Jos termi- 
valinnat eivät ole kohdeyleisölle tuttuja, lukija ei välttämättä löydä 
haluamaansa tietoa nopeasti katsomalla sisällysluetteloa. Vaikkapa mo- 
nissa mandariinikiinan kieliopeissa yleinen termi disposal construction 
on tuttu kaikille kiinalaisiin kieliin perehtyneille, mutta muunlaisesta 
taustasta tuleva kielitypologi ei todennäköisesti tiedä, että kyseinen ter- 
mi viittaa kiinalaisten kielten kuvaustraditiossa semanttisten ja prag- 
maattisten seikkojen säätelemään objektin merkintään. Jälkimmäiselle 
kohderyhmälle termi Differential Object Marking olisikin paljon tutumpi. 
Kuitenkin kieliopissa kuvattujen ilmiöiden huolellinen selittäminen ja 
käytettyjen termien määrittely on vielä tärkeämpää kuin terminologiset 
valinnat. Kielioppia aineistonaan käyttävien typologien työtä helpottaa, 
jos kielioppiin (esim. hakemistoon) merkitään myös, mikäli jotakin kes- 
keistä kategoriaa ei löydy kielestä. Kaikkia mahdollisia kategorioita ei tie- 
tenkään voida luetella, mutta jos jokin tutkittavan kielen sukukielille tai 
saman alueen kielille erityisen tyypillinen rakenne puuttuu tukittavasta 
kielestä, tästä olisi hyvä erikseen mainita. Samoin jos jostakin kieliopin 
ilmiöstä ei vielä ole riittävää tietoa, tämä tulee mainita kieliopissa sen 
sijaan, että ilmiö jätettäisiin kokonaan käsittelemättä. Hyviä ohjeita kieli- 
opin kirjoittamiseen kohdeyleisön näkökulmasta sisältää esimerkiksi 
Noonan (2006). 


3. Kielenkuvaushankkeen suunnittelu 


Kielenkuvaushankkeen kohdekieli on yleensä tutkijalleen ennalta aina- 
kin osittain tuntematon, ja kenttätyö tapahtuu tutkijan kannalta monel- 
ta osin vieraassa ympäristössä. Niinpä huolellinen valmistautuminen 
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etukäteen on onnistuneen kenttätyömatkan edellytys. Tässä luvussa 
keskitymme valmistelutyöhön, jota onnistunut kielenkuvaushanke ja 
kenttätyö edellyttävät. Luvussa 3.1. tuomme esiin kenttämatkan etu- 
käteissuunnitteluun liittyviä käytännön asioita tutkijan kannalta. Luvus- 
sa 3.2. tarkastelemme kenttätyötä tutkijoiden ja kielenoppaiden yhteis- 
työn näkökulmasta. 


3.1. Kenttätyön käytännön valmistelut 


Kenttätyön suunnitteluun vaikuttavat usein huomattavasti itse tutkimus- 
tilanteen ulkopuoliset tekijät. Eräs tärkeimmistä seikoista on kohteena 
olevan alueen poliittinen ja turvallisuustilanne. Lisäksi joissakin mais- 
sa (esim. Pohjois-Venäjällä tai Länsi-Kiinassa) tietyt alueet voivat olla 
ulkomaalaisilta suljettuja tai niillä liikkumiseen vaaditaan erikoislupa. 
Alueelle, jolla ulkomaalaisten liikkumista on rajoitettu, on ehkä mah- 
dollista matkustaa vain muutamaksi viikoksi tai kuukaudeksi kerrallaan, 
eikä usean kuukauden mittainen kenttätyö näin ole mahdollista. Moniin 
maihin on haettava viisumi ennen matkaa, ja joissakin maissa saatetaan 
viisumin lisäksi vaatia erillisiä lupia paikallisviranomaisilta. Esimerkiksi 
Venäjälle tai Kiinaan suuntautuvalla kenttätyömatkalla tutkijoiden täytyy 
ennen matkaa anoa viisumit ja kohdealueelle saapumisen jälkeen vielä 
rekisteröityä paikalliselle viranomaiselle. Hotellit hoitavat rekisteröinnin 
automaattisesti, mutta mikäli tutkijat majoittuvat esimerkiksi paikalli- 
sen perheen luo, on rekisteröitymisestä huolehdittava itse. Poliittisen 
tilanteen lisäksi kenttätyön suunnitteluun vaikuttavat myös esimerkik- 
si paikalliset luonnonolot, kulkuyhteydet ja majoitusmahdollisuudet. 
Esimerkiksi vaativissa luonnonolosuhteissa, kuten korkealla vuoristos- 
sa, tai vaikeiden kulkuyhteyksien päässä sijaitseva matkakohde asettaa 
työskentelylle omat haasteensa. Kulkemista syrjäisimpiin kohteisiin tai 
majoittumista niissä ei välttämättä ole mahdollista järjestää etukäteen, 
vaan paljon voi jäädä järjestettäväksi paikan päällä. 

Myös tutkijoiden oma elämäntilanne, terveydentila, kielitaito, per- 
soonallisuus ja henkilökohtaiset mieltymykset vaikuttavat kenttä- 
työn suunnitteluun, aina valitusta kohteesta majoitusratkaisuihin ja 
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työskentelytavoista kenttätyön kestoon. Riittävä kielitaito kohdealueel- 
la työskentelyyn ja käytännön asioiden hoitamiseen on onnistuneen 
kenttätyön edellytys. Monissa maissa puhutaan laajalti jotakin suurta 
eurooppalaista kieltä, jonka taito on suomalaistutkijoiden keskuudessa 
yleistä (esim. englanti, ranska, espanja), mutta on myös alueita, joilla 
työskentelyyn tarvitaan hieman harvemmin osattuja kieliä (esim. Kiinas- 
sa mandariinikiinaa, Papua-Uuden-Guinean alueella tok pisiniä). Taa- 
takseen onnistuneen yhteistyön kieliyhteisön kanssa ammattitaitoinen 
tutkimusryhmä perehtyy etukäteen myös paikalliseen kulttuuriin, kuten 
tapoihin, uskontoihin, kohteliaisuusnormeihin, alkoholinkäyttötottu- 
muksiin ja sukupuolirooleihin. Paikallisten tapojen kunnioittaminen 
on kenttätyötä tehdessä ehdottoman tärkeää, ja on hyvä tiedostaa, että 
esimerkiksi länsimaissa hyväksytyt tavat pukeutua tai käyttää alkoholia 
eivät ole yhtä hyväksyttyjä kaikissa kulttuureissa. On tärkeää, että kenttä- 
työtä suunnitteleva ryhmä kykenee työskentelemään pitkäjänteisesti 
kotimaastaan poikkeavissa olosuhteissa ja myös viihtymään kentällä ja 
nauttimaan työskentelystä. 

Kenttätyömatkan valmisteluihin kuuluvat luonnollisesti myös matka- 
budjetin laatiminen ja rahoituksen järjestäminen, matkojen ja majoitus- 
ten järjestäminen, kohdealueen tartuntatautitilanteen selvittäminen ja 
tarvittavien rokotusten hankkiminen sekä kenttämateriaalin keruussa 
ja matkalla tarvittavien materiaalien ja tarvikkeiden hankinta ja testaa- 
minen. Välttämättömiä ennakkovalmisteluja ovat myös nauhoitus- ja 
tutkimustilanteiden sekä tehtävien suunnittelu, joista kerrotaan enem- 
män luvussa 4. Lisäksi käydään läpi tutkimusmateriaalin nauhoituk- 
seen tarvittava tekniikka sekä audio- ja videotallenteiden formaatti 
jatkokäytettävyyden mukaan. Äänitiedostoille esimerkiksi suositellaan 
pakkaamatonta WAV-tiedostomuotoa, mutta on toki huomattava, että 
tiedostoformaatit ja vastaavasti suositukset niiden käytöstä uusiutuvat 
jatkuvasti. Etukäteen on mietittävä myös aineiston varmuuskopiointi 
kentällä useammalle kovalevylle ja tilanteen salliessa verkkosijaintiin. 
Ennen kenttätyötä on hyvä suunnitella myös litterointi- ja transkriptio- 
tavat sekä taustatietojen kokoaminen tarvittavia metatietoja varten (ks. 
luku 5.1. ja 5.2.). Lisäksi kenttätyöhön kuuluu oleellisesti kenttäpäivä- 
kirjan kirjoittaminen päivittäisistä toimista, havainnoista, kysymyksistä, 
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vastauksista ja oivalluksista. Aineistojen koostamiseen, kuvailutietoihin, 
litterointiin ja arkistointiin liittyviä asioita käydään tarkemmin läpi lu- 
vussa 5. 


3.2. Yhteisö ja kielenoppaat 


Ennen matkaa kenttätyötä suunnitteleva tutkijaryhmä hankkii tavalli- 
sesti tutkimuksen kannalta välttämättömiä kontakteja sekä tutkittavan 
kielen puhujiin että paikallisiin instituutioihin, kuten yliopistoihin tai 
paikallisviranomaisiin. Esimerkiksi paikalliset tutkijat tai kulttuurityön- 
tekijät ovat usein hyviä yhteistyötahoja, jotka voivat tarvittaessa auttaa 
etsimään työskentelyyn halukkaita kielenoppaita, tutkijoita majoittavia 
perheitä ja muita tarvittavia kontakteja. Tutkittavan yhteisön jäsenten 
on mahdollisuuksien mukaan hyvä olla jo etukäteen tietoisia tutkijan 
saapumisesta ja halukkaita osallistumaan kielenkuvaushankkeeseen. 
Usein kielenoppaat valikoituvat kuitenkin sattumien ja kentällä luotujen 
kontaktien kautta. Lisäksi paikallisten ihmisten voi olla aluksi vaikea 
ymmärtää kielenkuvaushankkeen tarkoitusperiä, ja tutkijoiden tavoitteet 
avautuvat heille hiljalleen yhdessä työskentelyn myötä. 

Työskentelyn onnistumiseen, aineiston laatuun ja tulosten yleistet- 
tävyyteen vaikuttaa suuresti se, keitä hankkeeseen osallistuvat kielen- 
puhujat ovat eli millaiset ihmiset antavat äänensä kielenkuvaushank- 
keelle. Tutkimukseen osallistuvia kielenpuhujia kutsutaan kielenoppaiksi, 
joskus käytetään myös termejä informantti, konsultantti ja kielimestari. 
Työskentelyyn kielenoppaiden kanssa vaikuttaa tutkijoiden ja kielen- 
oppaiden välisen vuorovaikutuksen luontevuus: kuinka helposti syntyy 
keskustelua, miten hyvin kielenopas lähtee mukaan tutkijan ehdotta- 
miin tutkimusasetelmiin tai kuinka mielellään hän kertoo tutkijan toi- 
vomista aiheista. Suuri vaikutus on myös kielenoppaan kielitajulla (ks. 
Kielitaju kielentutkijan työkaluna tk.) eli sillä, miten hän itse jäsentää 
kieleen ja sen käyttöön liittyviä ilmiöitä ja miten samalla aaltopituudella 
hän on tutkijan kanssa. Tutkijan kannalta hyvä kielenopas on luonte- 


va ja rohkea omassa kielenkäytössään, ei arvioi omaa kielitaitoaan liian 
huonoksi (tämä saattaa olla joskus tilanne monikielisten, valtakieltä 
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päivittäisenä kielenään käyttävien vähemmistökielen puhujien tapauk- 
sessa) eikä pelkää korjata tutkijan tekemiä kielivirheitä ja väärinymmär- 
ryksiä. Erilaiset ihmiset voivat sopia kielenoppaiksi erilaisiin tarpeisiin. 
Esimerkiksi joku, joka ei tunne oloaan lainkaan luontevaksi nauhoi- 
tustilanteessa, saattaa olla erinomainen apu tutkijalle muun kerätyn 
materiaalin purkamisessa ja aineistosta esiin nousseiden ilmausten ja 
vuorovaikutustilanteiden merkitysten selittämisessä. 

Eri puhujat käyttävät kieltä eri tavoin, ja toisaalta samat ihmiset pu- 
huvat eri tilanteissa eri tavoin. Yhden ihmisen idiolekti ei kerro välttä- 
mättä siitä, miten muut saman yhteisön jäsenet kieltä käyttävät. Lisäk- 
si kaupassa asioitaessa tai koululuokassa ei välttämättä käytetä kieltä 
samalla tavalla kuin kotona perheenjäsenten keskuudessa. Aineiston 
edustavuuden kannalta tutkijoiden on siis otettava huomioon kielen käy- 
tön variaatio. Tästä syystä kielenoppaiksi pyritään löytämään eri-ikäisiä 
ja eri sukupuolia edustavia ihmisiä, mahdollisesti myös monenlaisten 
ammattien tai sosiaalisten asemien edustajia. Vastaavasti ihanteena olisi 
tallentaa kieltä erilaisissa vuorovaikutustilanteissa. Kielenoppaan valin- 
taan vaikuttaa kuitenkin myös se, kuinka uhanalainen tutkittava kieli 
on. Jos kielellä on hyvin vähän puhujia jäljellä, voidaan käytännön syistä 
joutua työskentelemään esimerkiksi vain yhden kielenoppaan kanssa. 
Kenttätyötilanteet vaihtelevat suuresti, ja yhtä kaikkiin tilanteisiin sopi- 
vaa nyrkkisääntöä kielenoppaiden valinnasta ei ole. 

Vaikka onnistunut kenttätyö edellyttää suunnitelmallisuutta ja ennal- 
ta mietittyjen tutkimusasetelmien ja haastattelutilanteiden luomista, se 
on mitä suurimmassa määrin luovaa vuorovaikutusta, ihmissuhdetyötä 
ja aitoja kohtaamisia. Monesti voi olla tarpeen unohtaa suunnitelmat te- 
hokkaasta työskentelystä ja vain elää ja toimia tilanteen mukana. Kenttä- 
työssä tutkijat matkustavat tavallisesti keskelle yhteisön arkielämää ja 
kiirettä ja saattavat asua paikallisten ihmisten luona, jolloin heistä on 
yleensä ylimääräistä vaivaa yhteisölle. Tutkijoiden on siksi tärkeää kun- 
nioittaa paikallisten omaa aikaa ja antaa myös itsestään osallistumalla 
yhteisön arkeen ja kompensoimalla ylimääräisiä kuluja ja vaivaa. Kenttä- 
tutkijan toimenkuvaan voi näin kuulua esimerkiksi halonhakkuuta, las- 
tenhoitoa ja illanviettoja, joissa kaukaa tulleilta vierailta voidaan odottaa 
esimerkiksi lauluesitystä. Kenttätyö vaatii joustavuutta, kärsivällisyyttä 


LUKU 13 KIELTEN DOKUMENTOINTI JA KIELIOPIN KUVAUS 617 


ja kykyä ymmärtää, että paikallisilla ihmisillä on paljon muitakin velvol- 
lisuuksia ja intressejä kielenkuvaushankkeeseen osallistumisen lisäksi. 

Kenttätyö sisältää myös suuren tutkimuseettisen vastuun. Tutkijoiden 
on aina tilanteita ja vuorovaikutusta tallentaessaan huolehdittava, että 
osallistujat tietävät, mitä nauhoitetaan, miksi ja mihin nauhoitus päätyy. 
Nauhoittamiseen ja materiaalin jatkokäyttöön on oltava aina osallistu- 
jien antama suostumus tai tutkimuslupa, joko kirjallisessa tai suullisesti 
tallennetussa muodossa. Valmisteluun kuuluu tutkittavien taustatieto- 
jen keräämisen ja tutkimusprosessin suunnittelu eettiset kysymykset 
huomioon ottaen. Tutkijan on etukäteen mietittävä mm. tekijänoikeus- 
ja yksityisyydensuoja-asioita, suunniteltava lupien kysyminen tutkimuk- 
seen ja laadittava mahdolliset suostumuskaavakkeet tutkimusta varten. 
Osallistujien tulee olla tietoisia siitä, mihin heiltä kerättyjä materiaaleja 
käytetään, miten niitä käsitellään ja minne aineistot päätyvät. Tutkijan 
täytyy voida perustella, miksi hänen keräämänsä osallistujia koskevat 
tiedot ovat tarpeellisia. Pitää muistaa, että esimerkiksi terveydentilaa 
koskevia tietoja voi tulla esille spontaaneissa nauhoitetuissa keskuste- 
luissa, ja tällaistenkin tietojen käsittely tulee ottaa huomioon osallistu- 
jien informoinnissa. On myös tärkeää, että osallistujilla on tutkimuk- 
sen aikana mahdollisuus muuttaa mieltään ja vetää pois tuottamansa 
materiaali. 

Tutkimusaineistoon liittyvä eettinen ennakkoarviointi tehdään suun- 
nitteluvaiheessa aineiston koko elinkaaren näkökulmasta. Suostumus- 
ten kirjaamisessa ja osallistujien informoinnissa aineiston käyttötapa ja 
käsittely on tärkeää kuvata niin, että aineisto voidaan myöhemmin luo- 
vuttaa tutkimusyhteisön käyttöön myös muihin, eri tieteenalojenkin tut- 
kimustarkoituksiin, mahdollisesti myös opetus-, taide- ja kulttuurityön 
tarkoituksiin sekä kielenpuhujille itselleen. Yliopistoilla ja tutkimus- 
laitoksilla, osin myös kieliarkistoilla ja aineistoinfrastruktuureilla, on 
tutkimusdatan keräämistä, tallentamista, käyttöä ja hallintaa koskevia 
periaatteita ja linjauksia (esim. tutkimusdatapolitiikka), joihin kannattaa 
tutustua ennen kenttätyötä. Hyvä peruslähde on Yhteiskuntatieteellisen 
tietoarkiston Aineistonhallinnan käsikirja. 

Lisäksi ennen matkaa on suunniteltava, millä tavoin hankkeeseen 
osallistuvien kielenoppaiden työ ja aika korvataan. Tutkimusmateriaalin 
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palauttaminen kieliyhteisölle ja erilaisten kieliaineistojen (esim. oppi- 
materiaali, digitaaliset aineistot) tuottaminen kieliyhteisön hyväksi on 
tässä isossa roolissa, mutta joissakin tapauksissa myös rahallinen kor- 
vaus kielenoppaille tulee kysymykseen. Mikäli kielenoppaille on tarpeen 
maksaa työskentelystä, sopiva summa on syytä selvittää etukäteen aluet- 
ta hyvin tuntevilta tahoilta tai vaikkapa paikallisista palkkataulukoista. 
Liian pieni korvaus ei ole tietenkään suotavaa, mutta myös liian suurten 
summien maksamisesta voi aiheutua ongelmia. Ylisuurten palkkioi- 
den maksaminen voi esimerkiksi aiheuttaa eripuraa yhteisön sisällä tai 
saada aikaan sen, että tutkimukseen osallistuminen ei enää ole kaikille 
yhteisön jäsenille vapaaehtoista, jolloin kielenoppaat saattavat painostaa 
muita osallistumaan hankkeeseen saadakseen itse työtä ja rahaa. Liika 
avokätisyys rahapalkkioissa voi vaikeuttaa myös muiden tutkijoiden toi- 
mimista alueella, kun suuriin palkkoihin tottuneet kielenoppaat eivät 
hyväksy muualta tulevien tutkijoiden maksamia summia (tämä on muo- 
dostunut paikoin ongelmaksi esim. Venäjällä). Palkkioiden maksami- 
sessa on huomioitava myös alueelliset säädökset työn maksullisuuden 
vaikutuksesta tekijänoikeuteen. 


4. Kenttätyöaineiston keruumenetelmiä 


Kielitieteellinen kenttätyö ei välttämättä aina liity kielenkuvaushankkee- 
seen. Kenttätyötä voidaan tehdä hyvin erilaisia tutkimusasetelmia varten 
missä tahansa kielenkäyttöympäristössä ja -tilanteessa (ks. myös Ling- 
vistinen etnografia toimintayhteisöissä tk.). Kenttätyötä tarvitaan, kun 
halutaan tutkia sellaisia ilmiöitä, kielenkäyttötilanteita tai kielimuotoja, 


joista ei ole saatavilla tutkimustarkoitukseen sopivia valmiita aineistoja, 
kuten sanomalehti- tai keskustelukorpuksia. Kenttätyö voi liittyä esimer- 
kiksi keskustelujen tutkimiseen asiointitilanteissa tai tietyissä toiminta- 
ympäristöissä, paikannimistön keräämiseen jonkin alueen asukkaita 
haastatellen tai erityyppisten kielen ilmiöiden havainnointiin jostakin 
vähemmän tutkitusta kielestä. Käytettävät keruumenetelmät riippuvat 
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aina tutkimuksen tavoitteesta. Koska referenssikieliopin kirjoittamiseen 
tähtäävä tutkimus edellyttää kielen kaikkien osa-alueiden tarkastelua, 
siihen liittyvässä kenttätyössä on sovellettava useita keruumenetelmiä. 
Kenttätyö edellyttää ennalta mietittyjen tutkimusasetelmien ja haastat- 
telutilanteiden luomista, jotta tutkijat saavat kerätyksi tarkoituksiin- 
sa soveltuvan ja käyttökelpoisen materiaalin. Tällaisia menetelmiä ja 
näkökulmia erilaisiin aineistonkeruutapoihin esittelemme seuraavissa 
luvuissa. 


4.1. Luonnollisen puheen tallentaminen 


Kenttätutkijan tavoitteena on kielen tallentaminen mahdollisimman 
luonnollisessa muodossa ja käyttöympäristössä. Luonnollisen vuorovai- 
kutuksen tallentaminen liittyy tyypillisesti pitkäkestoiseen etnografiseen 
kenttätyöhön (ks. myös Lingvistinen etnografia toimintayhteisöissä tk.), 
jonka yhteydessä puhutaan usein osallistuvasta vuorovaikutuksen ha- 


vainnoinnista. Luonnollista vuorovaikutusaineistoa ja kerrontaa voidaan 
tallentaa myös haastattelutilanteissa. Usein työskentely kielenoppaiden 
kanssa alkaakin taustatietohaastattelulla, jota seuraavat jatkokeskuste- 
lut ja -kertomukset ovat usein arvokkaita nauhoitusaineistoja, joissa 
kielenoppaat kertovat vapaasti heille läheisistä aiheista. Erityisesti iäk- 
käämmät kielenoppaat saattavat mielellään kertoa asuinalueensa his- 


toriasta, omasta elämästään ja perhehistoriastaan (ks. myös Haastatte- 
lu aineistonkeruun metodina sosiolingvistiikassa tk.). Toiset saattavat 


puhua innokkaasti paikallisista tavoista ja ihmisistä tai ajankohtaisista 
tapahtumista ja kertoa niihin liittyviä anekdootteja. Paikkoihin liittyviä 
kertomuksia taas saattaa poikia paikannimistöä keräävien tutkijoiden 
haastatteluista, joilla pyritään yleensä muodostamaan kokonaiskuva 
alueen lähiympäristöstä, talojen, metsien, peltojen tai muiden paik- 
kojen sijainneista ja nimityksistä. Asutus- ja paikallishistoriaa käsit- 
televät keskustelut ja kertomukset toimivat usein monipuolisena ai- 
neistona, jota voi kieliopin kuvaamisen lisäksi hyödyntää esimerkiksi 
kielisosiologisen historian, kielikontaktien tai paikannimistön tutki- 
muksessa. Perinteisemmin kenttätyössä käytettyjen (kielijelämäkerta- ja 
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paikallishistoriahaastatteluiden ja tarinoiden kertomisen lisäksi mitkä 
tahansa tutkijaa kiinnostavat aiheet, joista kielenoppaat innostuvat, so- 
pivat vapaan puheen nauhoittamiseen. 

Vaikka kenttätyön tavoitteista, nauhoitustilanteista ja aineiston käy- 
töstä on tärkeää sopia kielenoppaiden kanssa, tutkijoiden ei välttämättä 
kannata paljastaa aivan suoraan tutkimiaan kielen ilmiön yksityiskohtia, 
jotta osallistujat eivät ala kiinnittää huomiota kyseiseen rakenteeseen 
puheessaan. Vapaata puhetta tallentavien tutkijoiden tehtävänä onkin 
luoda mahdollisimman luonteva keskustelutilanne, kuunnella ja antaa 
tilaa puhujille. Seuraavan kysymyksen tai tilanteen ohjaamisen kanssa ei 
kannata kiirehtiä, vaan on parempi odottaa, jatkaisiko puhuja vielä het- 
ken tuumittuaan. Tämän on yksi jos toinenkin kenttälingvisti oppinut 
kantapään kautta kuunnellessaan nauhoituksiaan jälkikäteen. Useim- 
miten tutkijoiden ja tallennusvälineiden läsnäolo kuitenkin vaikuttaa 
osallistujien kielenkäyttöön, ainakin aluksi (ns. tarkkailijan paradoksista 
ks. Labov 1972, 209). Puhujat saattavat huomaamattaan muokata tai 
siistiä puhettaan ja valita ilmaisutapoja, jotka kokevat hienoksi ja hy- 
väksi tavaksi käyttää kieltä. He voivat nauhoitustilanteessa esimerkiksi 
suosia mahdollisesti olemassa olevaa standardisoitua yleiskieltä tai ar- 
vostamaansa varieteettia tavallisen puhetapansa sijaan. Joissakin kie- 
lissä yhteisön ulkopuolisen ihmisen läsnäolo puhetilanteessa vaikuttaa 
jopa kieliopillisten muotojen valintaan, kun puhujien ei ole esimerkiksi 
yhteisön paikallishistoriasta kertoessaan mahdollista käyttää sellaisia 
kieliopillisia muotoja, joilla viitataan kaikkien läsnäolijoiden jakamaan 
intersubjektiiviseen tietoon (Berggvist 2016). Vaikka tutkijan läsnäolon 
mahdollinen vaikutus on hyvä tiedostaa, monesti myös tutkijan ohjaa- 
mien kielenkäyttötilanteiden (stimulukset ja lavastetut kielenkäyttötilan- 
teet, ks. luku 4.2.) voidaan katsoa edustavan suhteellisen luonnollisesti 
tuotettua kieltä. 

Kielen dokumentointia varten tehdyt nauhoitukset puretaan taval- 
lisesti jollakin tasolla jo kenttätyökohteessa, sillä niiden sisältöjen ja 
rakenteiden täsmällinen ymmärtäminen vaatii usein äidinkielisen pu- 
hujan apua. Kaikki vapaata puhetta sisältävät nauhoitukset onkin hyvä 
käydä läpi yhdessä kielenoppaiden kanssa, tapahtui se sitten kenttä- 
työkohteessa heti, myöhemmin nauhoitustilanteen jälkeen tai paljon 
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myöhemmin internetyhteyden välityksellä, esimerkiksi videopuheluiden 
avulla. Nauhoituksissa esiintyvistä rakenteista ja ilmiasuista myös he- 
rää usein lisäkysymyksiä, joiden tutkimusta on hyvä päästä jatkamaan 
kenttätyön aikana muiden metodien avulla. Kun tutkimuksen tarkoi- 
tuksena on kattaa kaikki tai useimmat kieliopin osa-alueet, vapaata pu- 
hetta sisältävät nauhoitukset eivät yksin riitä aineistoksi. Tallennetuissa 
kertomuksissa ei välttämättä tule esiin vaikkapa käskymuotoja tai kysy- 
myslauseita. Toisaalta tietyt kieliopilliset muodot, ilmaisut tai rakenteet 
saattavat olla arkipuheessa harvinaisia, tai ne voivat ilmetä vain raja- 
tuissa tilanteissa, ja niiden merkitykset saattavat riippua puhetilanteen 
osallistujista. Joitakin tutkimuskysymyksiä varten tarvitaan muita me- 
netelmiä, erityisesti lavastettuja kielenkäyttötilanteita, joissa tutkijalla 
on mahdollisuus kontrolloida, muuttaa ja tarkistaa osallistujien puheen 
välittömään kontekstiin liittyviä tekijöitä. Näitä menetelmiä käsitellään 
seuraavaksi. 


4.2. Stimulukset ja lavastetut kielenkäyttötilanteet 


Kun kenttätutkija ohjaa tavalla tai toisella kielenkäyttötilannetta, puhu- 
taan elisitaatiotekniikoista. Tällaisia voivat olla virikkeet eli stimulukset, 
joiden tarkoitus on antaa osallistujille puheenaiheita ja ohjata heitä käyt- 
tämään kieltä valikoiduissa tilanteissa tai puhumaan tutkijan toivomis- 
ta aihepiireistä. Virikkeitä voidaan käyttää yhtä lailla yksilö- tai ryhmä- 
haastatteluissa, tutkimusasetelman tarpeen mukaan. Niiden tarkoitus 
on myös saada puhujat käyttämään kieltä luonnollisesti ilman toisen 
kielen vaikutusta, kuten tapahtuisi käännettäessä valikoituja lauseita ja 
sisältöjä suoraan yhteisestä metakielestä tutkitulle kielelle. Kenttätyössä 
käytettäviä virikkeitä voivat olla piirrokset, valokuvat, kuvasarjat, videot ja 
esineasetelmat. Kielten kuvaushankkeissa paljon käytettyjä apuvälineitä 
ovat esimerkiksi päärynätarina (engl. Pear story‘, ks. Chafe 1980) ja sam- 
makkotarinat (engl. Frog stories’). Sammakkotarinat ovat kuvasarjoina, 
päärynätarinat videopätkinä esitettyjä lyhyitä juonellisia kertomuksia, 
joiden pohjalta kielenoppaiden tehtävänä on kertoa tarina kielellisessä 
muodossa. Virikkeenä voi toimia myös jonkin tutun asian valmistamista 
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tai muuta askaretta kuvaava lyhyt video, jonka tapahtumat tutkija pyy- 
tää kielenpuhujaa kertomaan järjestyksessä. Tarkkaan strukturoidussa 
elisitaatiotilanteessa tehtävänä voi myös olla lyhyen reitin neuvominen 
paikasta A paikkaan B kartan tai reittikuvan pohjalta. 

Paljon käytettyjä virikkeitä ovat myös erilaiset esineet, esimerkiksi 
nuket, ja niistä muodostettavat muuttuvat asetelmat, joista kielenoppaita 
pyydetään selittämään esineiden suhteita ja niiden kuvaamista tapah- 
tumissa. Kuvalliset tehtävät ja apuvälineinä käytettävät esineet toimi- 
vat hyvin virikkeinä konkreettisten ilmausten tutkimisessa. Tällaisia 
voivat olla vaikkapa värinnimitysten tunnistaminen kuvista, tekemis- 
tä kuvaavien tapahtumien (kuten rikkoa, hypätä, kiivetä) esittäminen 
kuvasarjoina tai videoina tai spatiaalisten suhteiden ilmausten (kuten 
edessä, taakse, alta) elisitoiminen leluasetelmien avulla. Hyviä esi- 
merkkejä esineasetelmien käytöstä tilan ja sijainnin sekä tapahtumien 
ilmausten tutkimisessa ovat Hellwig (2006) afroaasialaisen goemain 
kielen lokatiiviverbien tutkimuksesta, Brown (1993) mayakieli tzeltalin 
absoluuttisen spatiaalisen systeemin tutkimuksesta muovipaimenen 
ja muovipuun avulla sekä Benjamin Brueningin kehittämä the Scope 
Fieldwork Project -materiaali*. Erilaisia elisitaatiotekniikoita ja niiden 
soveltamista ovat kuvanneet yksityiskohtaisesti muun muassa Chelliah 
ja de Reuse (2011). Bouguiaux ja Thomas (1992) puolestaan sisältää 
runsaasti eri tarkoituksiin soveltuvia kyselylomakkeiden mallipohjia 
sekä piirroksia, joita voidaan käyttää erikoisalojen sanaston (esim. kas- 
villisuuteen ja eläimistöön liittyvän terminologian) keräämisen apuna. 
Kielten dokumentointiin ja kenttätutkimukseen soveltuvia materiaaleja 
on koottu tutkijoiden ladattaviksi myös eräiden typologiaan ja kielten 
dokumentointiin keskittyneiden instituuttien verkkosivuille. 

Stimulusten on hyvä olla kulttuurikontekstiin sopivia: jotkin aiheet 
voivat olla joissakin kulttuureissa tabuja, esim. kuvat tietynlaisesta vaa- 
tetuksesta tai sosiaalisesta käytöksestä voidaan kokea loukkaavina. Li- 
säksi materiaalin olisi kuvattava puhujille tuttua fyysistä ympäristöä ja 
tuttuja esineitä (ks. esim. Himmelmann 1998, 29). Päärynätarina ei sovi 
parhaalla mahdollisella tavalla pohjoissiperialaiseen kontekstiin, eivätkä 
muovileluja kuvaavat valmiit kuva-asetelmat tai sarjakuvat välttämättä 
avaudu kaikissa kulttuureissa. Paikannimistöä keräävän tutkijan työtä 
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voi hyödyttää suuresti, jos hänellä on mahdollisuus katsoa karttaa yh- 
dessä kielenoppaan kanssa, mutta kartanlukutottumus tai kyky tulkita 
karttojen ja kuvien mittakaavaa ei ole kaikkialla itsestäänselvyys. Toisaal- 
ta kielenoppaat saattavat hyvinkin luovasti osata korvata stimulusmate- 
riaalissa esiintyviä omalle kulttuurilleen vieraita asioita tutummilla, jol- 
loin kuvakortissa näkyvä lehmä korvautuu spontaanisti porolla, ananas 
omenalla ja palmu koivulla, tai toisin päin. 

Vähemmän ohjattu tutkimustilanne on sellainen, jossa tutkija voi 
näyttää tai esittää osallistujille jonkin kuvan, videon tai tekstin ja pyytää 
keskustelemaan sen pohjalta vapaammin. Tällaisia tutkimusasetelmia 
ovat lavastetut tai järjestetyt kielenkäyttötilanteet, joissa osallistujat ase- 
tetaan ennalta suunnitellun tehtävän äärelle. Tällaisilla tehtävillä voidaan 
pyrkiä luomaan kielenkäyttötilanteita, joissa esimerkiksi kielen ja sen ra- 
kenteiden pragmaattiset funktiot tulevat esille ja joissa niiden käyttöön 
liittyviä kontekstimuuttujia voidaan tarkastella. Tarkasti suunniteltu 
mutta hyvin vapaata puhetta tuottava tutkimusasetelma on esimerkiksi 
sellainen, jossa kielenoppaiden tehtävänä on (yhdessä tutkijoiden kans- 
sa) kävellä heidän yhteisölleen tai ympäristölleen merkittävä maastoreit- 
ti ja selostaa matkan varrella liikkumistaan ja vastaan tulevia kohteita. 
Australian alkuperäiskielten tutkijat ovat esimerkiksi keränneet tällaisia 
maastokävelyiden reittiselostuksia, joita he ovat pystyneet yhdistämään 
tarkkoihin topografisiin ja sijaintitietoihin kielenoppaiden kantamien 
GPS-koordinaatteja ja videokuvaa tallentavien kameroiden avulla. Ai- 
neistoa on kerätty spatiaalisten suhteiden, suunnan ja liikkeen ilmaus- 
ten sekä paikannimistön tutkimiseksi. (Cialone 2017.) 

Modaaliset ja evidentiaaliset rakenteet sekä erityisesti niiden vuoro- 
vaikutukselliset funktiot ovat esimerkki kielen osa-alueista, joita ei yleen- 
sä ole helppo tavoittaa nauhoitetuista kertomuksista tai kaikista keskus- 
teluista. Niiden nauhoittamiseen ja elisitointiin on kuitenkin kehitetty 
hyvin toimineita tekniikoita. Esimerkiksi Silva ja AnderBois (2016) ovat 
tutkineet Etelä-Amerikassa puhuttavan desanon kielen evidentiaalisia ja 
episteemisiä (päättelyä ja todennäköisyyttä merkitseviä) ilmauksia käyt- 
tämällä apuna Mastermind-lautapeliä. Logiikkapelin tarkoituksena on 
päätellä eriväristen nappuloiden järjestyksestä muodostettu oikea väri- 
koodi. Tutkijat pyysivät kielenoppaitaan pelaamaan peliä yhteistyössä 
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ja neuvottelemaan mahdollisuuksista ja vaihtoehdoista ja saivat siten 
nauhoitetuksi runsaasti päättelyä, epävarmuutta, todennäköisyyttä ja 
mahdollisuutta ilmaisevia rakenteita luontevissa käyttötilanteissa. San 
Rogue ja muut (2012) puolestaan ovat kehittäneet Family Problems 
Picture Task -nimisen 16 piirroskuvan kokoelman, jossa perheenjäse- 
niksi helposti tulkittavissa olevat ihmishahmot esiintyvät monenlaisissa 
tilanteissa, joissa hahmojen yllä olevien kuvitettujen puhekuplien avulla 
kuvataan ristiriitoja, tunteita ja dramatiikkaa. Tehtävään osallistuvien 
kielenoppaiden on tarkoitus samaistua hahmoihin ja tuntea ja ilmaista 
empatiaa näitä kohtaan, mistä syystä kuvasarja on toiminut hyvin kogni- 
tiivisia toimintoja kuvaavien ilmausten ja kategorioiden elisitoinnissa. 


4.3. Käännöstehtävät ja kieliopillisuusarviot 


Kielestä toiseen kääntäminen, niin sanottu käännöselisitaatio, ei kos- 
kaan ole ensisijainen tai suositeltava keino sen selvittämiseksi, miten 
kuvattavassa kielessä jokin asia ilmaistaan. Yksittäisten sanojen tai hyvin 
yksinkertaisten ilmausten kääntäminen on todennäköisesti ongelmaton- 
ta, mutta hiukankin monimutkaisemman ilmauksen tai lauseen kään- 
tämisessä on aina olemassa se riski, että kielenoppaat tuottavat tutkijan 
tarjoilemasta lauseesta sanatarkan käännöksen, joka ei kuitenkaan ole 
idiomaattinen tapa ilmaista asiaa heidän omassa kielessään. Konteks- 
tualisoitu elisitaatio, jossa tutkija antaa kielenoppaalle jonkin tilanteen 
tai tapahtuman, johon kielenopas täydentää haetun ilmauksen, toimii 
usein paremmin kuin pelkkä kääntäminen. 

Joissakin tilanteissa, esimerkiksi tutkittavan kielen taivutusparadig- 
moja kerättäessä, suoraan toisesta kielestä kääntäminen on kuitenkin 
hyvä menetelmä. Käännöslauseiden elisitoinnilla voidaan täydentää tai 
tarkistaa kielen kuvausta varten joitakin keskustelussa ja kertomuksissa 
harvemmin esiintyviä muotoja. Tällainen voisi olla vaikkapa subjekti- ja 
objektikongruenssia merkitsevä taivutuspääte subjektin monikon toi- 
selle persoonalle ja objektin kaksikolle (’Te [sinä, Anna ja Liisa] olette 
lukeneet nuo kirjat [2 kpl]’). Myös esimerkiksi kielen foneemien erotte- 
lussa suora kääntäminen voi olla nopea keino tarkistaa minimipareja eli 
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sanapareja, jotka eroavat toisistaan vain yhden äänteen kohdalla. Kään- 
nösten ohella toinen hyvin suoraviivainen ja siksi myös varovaisesti käy- 
tettävä tutkimusmetodi on tutkijan tarjoamien muotojen ja ilmausten 
kieliopillisuuden arvioituttaminen kielenoppaalla. Hyväksyttävyystestit 
("Voiko näin sanoa, onko tämä oikein?”) voivat olla hyvin oleellisia kieli- 
opin kokonaiskuvauksen kannalta, jolloin myös negatiivinen evidenssi 
on tärkeää. Se, onko joidenkin kieliopillisten muotojen yhdistäminen 
kielessä mahdotonta vai eikö yhdistelmä vain ole esiintynyt tutkijan ai- 
neistossa, selviää yleensä parhaiten hyväksyttävyystesteillä. Esimerkiksi 
suomen kielen potentiaali ei useimpien puhujien kielitajun mukaan 
toimi imperfektissä (Pohtinen tätä tänään mutta * Pohtinin tätä eilen). 

Kielentutkijan tarkoitusta hyvin ymmärtävän ja kielioppiin analyytti- 
sesti suhtautuvan kielenoppaan kanssa voi olla helppoa käydä joitakin 
asioita läpi käännöslauseiden ja hyväksyttävyysarvioiden avulla, mutta 
on muistettava, että kuten tutkijankin oma kielitaju myös informan- 
tin kielitaju saattaa pettää. Esimerkiksi kohteliaisuus- tai arvotussyistä 
kielenopas saattaa vakuuttaa tutkijalle (ja itsekin uskoa) ilmaisevansa 
jonkin asian toisella tavalla kuin tositilanteessa sanoisi. Työskennellessä 
on tärkeää huomioida myös kielenoppaan jaksaminen ja väsymyksen 
vaikutus. Kielenopas voi väsyneenä esimerkiksi hyväksyä epäkieliopilli- 
sia muotoja joko epähuomiossa tai siksi, ettei enää jaksa korjata niitä. 
Liian pitkiä työskentelysessioita ja useita samanlaisia peräkkäisiä teh- 
täviä on siis vältettävä, jotta keskittyminen pysyy yllä. On myös muis- 
tettava, että joissakin tapauksissa elisitointitehtävät voivat olla ainoa 
mahdollinen aineistonkeruumenetelmä. Luonnollisen kielen nauhoit- 
taminen ei ole aina mahdollista silloin, kun kyseessä on hyvin vakavasti 
uhanalainen kieli. Tällöin kieltä vielä osaavien ihmisten kielitaito voi 
olla puutteellinen, kun he eivät enää käytä tutkittavaa kieltä aktiivisesti 
arkielämässään. 
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Sanastoa 


Annotaatio: puheen tekstimuotoon saattamisessa käytettävä merkintä- 
taso, kuten litteraatti, käännös, sanasto- ja morfeemianalyysi. 


Elisitaatio (kirvoitus, engl. elicit 'saada esiin’): tutkijan käyttämä kenttä- 
työaineiston keräystekniikka. 


Glossaus: kolmelle riville merkittävä morfeemianalyysi, jossa erotetaan 
kielenaineksesta sana- ja morfeemirajat, nimetään morfeemit ja merki- 


tään käännös. 


Kielenopas (informantti, konsultantti, kielimestari): kenttätyössä haasta- 
teltava tutkittavan kielen puhuja. 


Litterointi: nauhoitteen kirjoittaminen tekstimuotoon. 


Metadata eli metatiedot: aineiston yhteyteen tallennettavat taustatiedot 
kenttätyötilanteesta. 


Stimulus (virike): apukeino, jolla pyritään herättämään ja ohjaamaan 
puhetta. Esim. video, peli, kuva, esine. 


Transkriptio: deskriptiivinen puheen kirjoitustapa, jolla puhetta voidaan 
kuvata foneettisesti tai fonologisesti. 


5. Kenttätyökorpuksen koostaminen: 
materiaalista aineistoksi 


Kentällä kerätyn audio-, video- ja muun materiaalin työstäminen 
tutkimusaineistoksi ja kielen dokumentointihankkeen tulokseksi vaa- 
tii aina huolellista jatkokäsittelyä. Sekä kenttälingvistin omaa tutki- 
musta että muuta myöhempää käyttöä varten aineiston tulee olla hy- 
vin järjestetty ja merkitty käyttötarkoitukseen sopivilla tavoilla, ja se 
tulee valmistella pysyvää säilytystä ja yleensä myös julkaisua silmällä 
pitäen. Aineiston työstämiseen sisältyvät yleensä seuraavat työvaiheet: 
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materiaalin käsittely jatkokäytön ja siirrettävyyden mahdollistavilla sovel- 
luksilla ja tallennus ajallisesti kestäviin, siirrettäviin ja arkistointikelpoi- 
siin formaatteihin, aineistoa kuvailevan taustatiedon eli metadatan tuot- 
taminen, julkisuus- ja käyttöoikeusluokituksista päättäminen, aineiston 
osien litterointi tekstimuotoon, käännökset, eritasoiset sisältömerkinnät 
sekä arkistointi jatkokäytön ja pysyvän säilytyksen takaamiseksi. 


5.1. Aikakohdennetut annotaatiot 


Digitaalisesti tallennetun aineiston järjestelmällistä merkintää ja 
muistiinpanoin varustamista kutsutaan yleensä annotoimiseksi?. Kieli- 
aineistoihin sovellettavia merkintä- eli annotaatiotasoja ovat tyypillisesti 
ainakin puheaineiston tai sen osien litterointi eli puheen sisällön kirjoit- 
taminen tekstimuotoon sekä käännös aineiston käyttäjien kannalta täh- 
delliselle laajemmin ymmärretylle kielelle. Litteroinnin ja käännöksen 
lisäksi merkitään usein aineiston laadun ja käytön kannalta tarvittavia 
annotaatiotasoja, kuten lause-, sana- tai morfeemitason analyysit, vuo- 
rot, eleet ja puheen sisältöä koskevat merkinnät. Kieliopin kuvaamista 
varten tehdään tavallisesti litterointi sekä lause-, sana- ja morfeemitason 
annotaatiot. Aineiston käyttötarkoitus määrää sen, mitä osia materiaalis- 
ta annotoidaan ja millä tavoilla. 

Litteroinnissa valitaan sellainen kirjoitusjärjestelmä eli transkriptio, 
joka yhtäältä palvelee parhaiten aineiston ensisijaista käyttötarkoitusta, 
toisaalta on ymmärrettävä ja helposti tulkittava mahdollisimman moni- 
puoliselle aineiston käyttäjäkunnalle. Jos tutkimuskohteena olevalla 
kielellä on oma puhujayhteisön käyttämä ortografia, voidaan sitä joko 
sellaisenaan tai muokattuna, esimerkiksi kyrilliseltä aakkostolta latina- 
laisille kirjaimille translitteroituna, käyttää litteroinnissa. Kielelle, jolla 
ei ole omaa kirjoitusjärjestelmää, käytetään aina kielitieteelliseen tutki- 
mukseen tarkoitettuja transkriptioita. Ennen äänitallenteiden aikakautta 
foneettinen transkriptio eli äänteiden hyvin täsmällinen merkintä tarke- 
kirjoituksella oli ensiarvoisen tärkeää kenttätyöaineistoissa. Nykyisin 
litteraatit voivat olla karkeampia, mutta tyypillistä on pyrkiä kuvaamaan 
transkriptiolla kielen foneemisto. Transkriptioiden tarkkuus riippuu 
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kuitenkin lopulta aineiston käyttötarkoituksesta. Kirjaimistoista nykyi- 
sin laajimmin käytössä on kansainvälinen foneettinen kirjaimisto IPA 
(International Phonetic Alphabet), jonka avulla voidaan merkitä kielten 
äänteitä ja foneemeja. Eri kielten ja kieliryhmien kirjoittamiseen käyte- 
tään myös muita kirjoitusjärjestelmiä, esimerkiksi suomalais-ugrilaista 
tarkekirjoitusta (SUT). 

Kieliopin kuvaukseen tarkoitettu aineisto usein glossataan eli se 
esitetään morfologisesti analysoituna. Glossaus on kielioppien lause- 
esimerkeissä ja kielennäytteissä käytetty esitystapa, joka kertoo kieli- 
opillisen perusrakenteen. Glossauksessa litteroituun kielenainekseen 
merkitään morfeemirajat, ja alemmalla sanarajojen mukaan kohdis- 
tetulla rivillä kerrotaan tarkka käännös kullekin sanavartalolle sekä 
sanamuotoon merkittyjen kieliopillisten kategorioiden lyhenteet 
kapiteelikirjaimilla. 


1) 
Tämä on esimerkki — glossa-tu-sta lausee-sta. 
this be.3sc example = gloss-PTCP.PST.PASS-ELA sentence-ELA® 


”This is an example of a glossed sentence.’ 


Tarkempia ohjeita glossaukseen antavat Leipzigin glossaussäännöt 
(Leipzig Glossing Rules"). Jotta glossiin merkitty rakenneanalyysi olisi hel- 
posti luettavissa myös analysoitua kieltä osaamattomalle tutkijalle, käyte- 
tään mahdollisuuksien mukaan vakiintuneita lyhenteitä, joista on tiivis 
lista Leipzigin sääntöjen yhteydessä; esimerkiksi lokatiivi lyhennetään 
Loc ja mennyt aika PST (past tense). Kielikohtaisille kategorianimityksille 
on kuitenkin syytä käyttää niitä kuvaavia lyhenteitä (esim. INE = inessiivi, 
ELA = elatiivi jne). Tärkeintä on, että käytetyt lyhenteet selitetään. 

Yksi tärkeimmistä digitaalisten apuvälineiden tuomista hyödyistä 
aineistonhallinnalle on litteraatin ja muiden annotaatiotasojen aika- 
kohdistaminen eli synkronointi nauhoitteen vastaavien osioiden kanssa. 
Aikakohdennetussa aineistossa audio- tai videonauhoitteen tietyn jak- 
son valitsemalla saa samalla esille siihen kohdennetut annotaatiotasot. 
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Tätä tarkoitusta varten on olemassa useita avoimeen lähdekoodiin ja 
xml-formaattiin perustuvia työkaluja. Kenttätyöaineiston annotointiin 
ja kielten dokumentointiprojekteihin hyvin soveltuva ohjelma on Elan", 
joka tukee sekä video- että audioaineistoja ja on tästä syystä käytössä 
myös viittomakielisten aineistojen käsittelyssä. Annotaatio-ohjelman 
valinta riippuu kuitenkin aina siitä, millaiset merkintätasot ovat tärkei- 
tä. Esimerkiksi puheanalyysiin ja foneettiseen tutkimukseen soveltuu 
hyvin Praat-ohjelma”, joka mahdollistaa akustisen analyysin ja puheen 
mallintamisen esimerkiksi spektrogrammeilla. Praat ei kuitenkaan tue 
videotiedostoja, mutta toisaalta se toimii hyvin yhteen Elanin kanssa. 
Annotointiohjelman valinnassa on otettava huomioon myös aineiston 
siirrettävyys arkistointiformaatin kannalta. Vanhentuneiden tai hanka- 
lasti siirrettävien tiedostomuotojen konvertointiin käytettävän formaatti- 
velan syntymistä on hyvä yrittää välttää suosimalla mahdollisimman laa- 
jasti käytettyjä tiedostoformaatteja ja ohjelmistoja. 

Koska audio- ja videomateriaalin tallentaminen on usein hyvin help- 
poa ja annotointi puolestaan erittäin aikaa vievää, koko kerätyn kenttä- 
aineiston tarkka merkitseminen vaatii usein laajahkon dokumentaatio- 
projektin ja useamman ihmisen työpanoksen. Kieliteknologian 
tarjoamat mahdollisuudet kehittyvät kuitenkin jatkuvasti, ja automati- 
soitua annotointia kehitetään myös vähän tutkittujen kielten ja niiden 
dokumentaation tarpeisiin (ks. esim. Gerstenberger, Partanen, Riefler 
& Wilbur 2016). 


5.2. Aineiston arkistointi ja jakaminen 


Jotta vaivalla kerätty ja annotoitu kieliaineisto ei unohdu tutkijan omalle 
koneelle odottamaan kovalevyn tuhoutumista, katoa jäljettömiin tutki- 
jan vaihtaessa alaa tai häviä yliopiston verkkopalvelujen uudistuessa, se 
arkistoidaan pysyväissäilytystä ajatellen. Tutkimuslaitokset ja instituutit 
eri puolilla maailmaa tarjoavat palveluja kieliaineistojen digitaaliseen 
arkistointiin sekä arkistoitujen aineistojen tutkimuskäyttöön. Suomes- 
sa kieliaineistojen pysyväissäilytystä ja tutkimuskäyttölupia hallinnoi 
Kielipankki, josta vastaa suomalaisten yliopistojen ja tutkimuslaitosten 
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muodostama konsortio. Kielipankin materiaalit ovat osa kansainvälistä 
aineistoinfrastruktuuria®, jonka tarkoitus on mahdollistaa materiaalien 
jakaminen yhteismitallisesti eri arkistointilaitosten ja niiden palveluita 
hyödyntävien tutkijoiden välillä. 

Aineiston arkistointi, jakaminen tutkija- ja kieliyhteisölle ja mahdol- 
linen muu jatkokäyttö on hyvä pitää mielessä jo nauhoituksia ja anno- 
taatioita tehtäessä. Tallenteiden tulee syntyhetkestään saakka olla sel- 
laisessa tallennusmuodossa, joka mahdollistaa niiden siirrettävyyden 
ja arkistoinnin, joten arkiston mahdolliset ohjeet tiedostoformaateista 
kannattaa tarkistaa etukäteen. Tallenteet tulee koko ajan järjestää ja ni- 
metä niin, että niiden luettelointi, merkitseminen ja kuvailu on mahdol- 
lisimman selkeää ja yksinkertaista. Myös varmuuskopiointi tulee ottaa 
huomioon jo kenttätyössä, ja kopiot tulee siirtää palvelinsäilytykseen 
esimerkiksi arkistoon heti kun olosuhteet sen sallivat. Hyvin järjeste- 
tyn aineiston yhteyteen kuuluvat aineiston kuvailutiedot, metatiedot eli 
metadata. Metatiedoilla tarkoitetaan arkistoinnin ja jatkokäytön kannalta 
oleellisia taustatietoja, joita ovat yleensä ainakin tarkat tiedot aineiston 
keruuajasta ja -paikasta sekä nauhoittajasta. Metatietoihin on hyvä liittää 
myös tiedot kustakin nauhoitustilanteesta, siihen osallistuvien ihmisten 
määrästä ja esimerkiksi iästä, sukupuolesta ja muusta taustasta sekä 
peruskuvaus puheenaiheesta ja nauhoituksen sisällöstä. Myös tiedot 
aineiston ja sen osien julkisuudesta, suojaamisesta ja käyttöoikeuksis- 
ta kuuluvat taustatietoihin. Kieliarkistot auttavat aineistojen julkisuus- 
luokitusten ja käyttölupamenettelyiden määrittämisessä. Jo nauhoi- 
tustilanteessa on siis otettava huomioon paitsi nauhoituksen laatu ja 
tallennusformaatti myös tarvittavien tietojen kokoaminen aineiston ku- 
vaamista ja luokittelua varten. Samalla on huolehdittava tutkimusluvista, 
joilla sovitaan myös nauhoitukseen osallistuvien puhujien oikeuksista 
(ks. myös luku 3.2). 

Hyvään tutkimusetiikkaan kuuluu paitsi aineistojen vapaa saatavuus 
myös tutkimukseen osallistuvien ihmisten yksityisyyden suojaaminen. 
Yhtäältä aineisto tulisi saattaa vapaasti tutkijoiden ja muiden käyttä- 
jien sekä kieliyhteisön käytettäväksi. Toisaalta aineiston koostajalla on 
suuri tutkimuseettinen vastuu nauhoituksiin ja tutkimustilanteisiin 
osallistuneiden ihmisten oikeuksista ja yksityisyydensuojasta. Tämä on 
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kielentutkimuksessa usein tarkoittanut aineistossa esiintyvien tunniste- 
tietojen, kuten nimien ja ammattien, pseudonymisointia julkaisuissa. 
Aineistoon kuuluvien video- tai audiotallenteiden anonymisoiminen ei 
kuitenkaan ole mahdollista pelkkiä nimiä muuttamalla: puheääni itses- 
sään on henkilötieto, ja tallenteet koostuvat monesti keskusteluista, joi- 
hin voi sisältyä monenlaisia tunnistetietoja, kuten henkilötietoja, juoruja 
ja mielipiteitä. Siksi tärkeintä onkin, että aineiston käytössä, käsittelyssä 
ja arkistoinnissa kunnioitetaan tutkimukseen osallistuneiden henkilöi- 
den toiveita ja heidän kanssaan sovittuja asioita. 

Tekijänoikeus kustakin aineiston tuottamisen työvaiheesta, esim. si- 
sällöstä tai annotaatiotasosta, on kyseisen osuuden tekijällä. Lisäksi on 
tarkistettava, sisältääkö kentällä tehty ääni- tai videotallenne materiaalia, 
jonka tekijänoikeuden voidaan tulkita kuuluvan jollekulle muulle kuin 
tallennustilanteeseen osallistuneille, esimerkkinä tutkimus- ja haastat- 
telutilanteen yhteydessä tallennettu lauluesitys. Paitsi tekijänoikeuksien 
tunnustaminen joissakin tapauksissa myös tarve kielenoppaiden työn 
tunnustamiseen ylipäänsä saattaa olla ristiriidassa yksityisyydensuojan 
turvaamiseen tähtäävien käytäntöjen kanssa. Jotkut kielenoppaat halua- 
vat nimenomaisesti esiintyä omalla nimellään ja saada julkisen tunnus- 
tuksen kielensä hyväksi tekemästään kulttuurityöstä. Kielenoppaiden 
määrä, heidän toiveensa anonymiteetistä tai nimellä esiintymisestä, ai- 
neiston luonne ja siihen mahdollisesti sisältyvät arkaluonteiset, esim. 
terveydentilaa koskevat aineistoon päätyneet tiedot vaikuttavat siihen, 
miten tekijyys ja hankkeeseen osallistumisen tunnustaminen ratkais- 
taan yksityisyydensuojaa kunnioittaen. 

Sama aineisto voi parhaimmillaan hyödyttää vuosikymmenten ajan 
useita erilaisia yleisöjä: tutkijoita, kieliyhteisön jäseniä, kulttuurista 
kiinnostuneita, suurta yleisöä (ks. Woodbury 2011). Sama aineisto voi 
palvella monia kielitieteen lähestymistapoja, kuten antropologista ling- 
vistiikkaa, kieliopin kuvausta, kielitypologiaa, fonetiikkaa, diskurssin- 
tutkimusta ja sosiolingvistiikkaa. Myös muut, yllättävätkin tieteenalat 
voivat hyödyntää kielitieteellistä tutkimusta varten kerättyä aineistoa. 
Ideaalitapauksessa pankkiin tallennettu kieliaineisto kasvaa korkoa: ai- 
neiston jatkokäyttäjät lisäävät oman lähestymistapansa kannalta rele- 
vantteja annotaatiotasoja korpukseen ja luovuttavat omat merkintänsä 
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edelleen aineistokokonaisuuden osaksi. Sujuvan aineistojen yhteis- 
käytön järjestäminen on suuri haaste, jonka ratkaisemiseksi tarvitaan 
tutkijayhteisön ja arkistolaitosten yhteistyötä (ks. myös Jalava 2011). 
Arkistoinnin ja pysyväissäilytyksen lisäksi on myös suunniteltava erik- 
seen, millä tavalla aineisto palautetaan kieliyhteisölle mahdollisimman 
käyttökelpoisessa muodossa. Kieliyhteisön jäsenet eivät välttämättä pysty 
lukemaan kielitieteellisiä merkintöjä tai käyttämään aineistoa erikois- 
ohjelmistoilla. Hyvä vaihtoehto voi olla raakadatan eli valikoitujen nau- 
hoitusten luovuttaminen kulttuuri-instituuteille ja -toimijoille kenttätyö- 
kohteessa sekä mahdollisuuksien ja tarpeiden mukaan painettujen tai 
digitaalisten tarinakokoelmien ja muiden materiaalien tuottaminen yh- 
teistyössä kieliyhteisön kanssa heidän ymmärtämällään kirjoitustavalla. 


6. Yhteenveto 


Olemme tässä artikkelissa tarkastelleet aiemmin kuvaamattoman tai 
vähän tutkitun kielen kuvaamista useista näkökulmista. Olemme esi- 
telleet kielten dokumentointiin ja kieliopin kirjoittamiseen tähtäävän 
kenttätyön vaiheet ja keskeiset aineistonkeruumenetelmät. Kielitieteelli- 
nen kenttätyö on aina monivaiheinen prosessi, joka koostuu varsinaista 
kenttätyömatkaa edeltävistä valmisteluista, työskentelystä kentällä sekä 
kenttäaineistojen koostamisesta korpukseksi, aineistojen arkistoinnista, 
julkaisemisesta eri muodoissa ja palauttamisesta kieliyhteisölle. Kieli- 
opin kirjoittamisessa työskentelyä ohjaavat alusta alkaen kohdeyleisön 
tarpeet; tavoitteena on selkeä ja lukijakunnalle helposti ymmärrettävä 
kokonaisuus, joka yhtäältä käsittelee järjestelmällisesti kieliopin kuvauk- 
sen keskeisiä osa-alueita ja toisaalta tuo esiin tutkittavan kielen erityis- 
piirteet. Kenttätyön pohjalta kirjoitettujen kielioppien aineisto sisältää 
tasapainoisessa suhteessa toisiinsa vapaata puhetta ja monenlaisiin la- 
vastettuihin kielenkäyttötilanteisiin, käännöstehtäviin ja kieliopillisuus- 
arvioihin perustuvia esimerkkejä. Tämä mahdollistaa sekä tutkittavan 
kielen kuvaamisen luonnollisessa käyttökontekstissaan että kaikkien 
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kieliopin osa-alueiden systemaattisen tarkastelun. Toivomme, että tämä 
lyhyt katsaus tarjoaa lukijalle yleiskuvan kielten dokumentoinnista ja 
kieliopin kirjoittamisesta ja kannustaa tutustumaan aiheeseen lisää. 
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VIITTEET 


1 Toki näinkin pieni prosenttiosuus maailman koko väestöstä on suuri joukko, noin 300 
miljoonaa ihmistä. Tämän joukon kesken jakautuu 6700 kieltä. Suurimmalla osalla 
maailman kielistä on siis keskimäärin korkeintaan muutama kymmenentuhatta puhu- 
jaa, todellisuudessa monella niistä vain joitakin kymmeniä. 

2 Hyviä esimerkkejä kielioppiluonnoksista löytyy esimerkiksi Lincom Europa -kustanta- 
mon julkaisemasta Languages of the World -julkaisusarjasta. Sarjassa ilmestyy 50-100 
sivun mittaisia kielioppiluonnoksia eri puolilla maailmaa puhutuista kielistä. Suoma- 
laisten tutkijoiden laatimia kielioppiluonnoksia julkaisusarjassa ovat Janhunen (2003) ja 
Janhunen, Peltomaa, Sandman ja Xiawu Dongzhou (2008). 

3 Nenetsin sanaluokkajaon logiikalle muunnettuna suomen kielen lauseke 'musta koira’ 
kuuluisi muodossa mustaava koira, jossa ’musta’ (mustata) olisi verbi ja esiintyisi siksi 
attribuuttiasemassa partisiippimuodossa. Sitä vastoin lauseke 'valkoinen koira’ raken- 
tuisi samalla periaatteella kuin suomessa todellisuudessakin: valkoinen koira, koska 
'valkoinen' olisi nomini. 

4 Suunnitellut Wallace Chafe (1980), saatavissa Mary S. Erbaughn verkkosivulla http:// 


www.pearstories.org/ (viitattu 23.12.2017). 
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5 Mercel Mayerin lapsille suunnatut kuvatarinat 1960- ja 1970-luvuilta, esim. Frog, Where 
Are You? (1969). 

6 https://www.eva.mpg.de/lingua/tools-at-lingboard/material scope fieldwork project. 
php. 

7 Tätä artikkelia kirjoitettaessa tärkeitä sivustoja ovat TulQuest (http://tulguest.huma- 
num.fr, viitattu 1.4.2018), jota ylläpitää French Federation de typologie et universaux 


linguistigues sekä Max Planck Institute for Evolutionary Anthropologyn entisen kieli- 
tieteen laitoksen sivu (https://www.eva.mpg.de/lingua/tools-at-lingboard/tools.php, 
viitattu 1.4.2018). 

8 Eri tutkimussuuntauksissa on erilaisia annotaatiokäytänteitä. Eri tarkoituksiin tarvitaan 


erilaisia ja eri tarkkuusasteiden merkintätasoja. Joskus aineiston järjestelmällisestä 
merkinnästä puhutaan myös aineiston koodaamisena. 

9 Lyhenteet: 3sc = yksikön 3. persoona, ELA = elatiivi, PTCP = partisiippi, PST = mennyt 
aika, PASS = passiivi. 

10 https://www.eva.mpg.de/lingua/resources/glossing-rules.php. 

11 Kehittäjä ja ylläpitäjä: Max Planck Institute for Psycholinguistics, The Language Archive, 


Nijmegen, Hollanti. Saatavissa: https://tla.mpi.nl/tools/tla-tools/elan/ (viitattu 


1.4.2018.). 
12 Kehittäjät ja ylläpitäjät: Paul Boersma & David Weenink. Phonetic Sciences, University 
of Amsterdam, Hollanti. Saatavissa: https://www.fon.hum.uva.nl/praat/ (viitattu 


23.12.2017). 
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Mikä? 


Kielitypologia on tutkimusalue, joka tutkii maailman kielten monimuo- 
toisuutta ja siihen vaikuttavia tekijöitä. Se on empiiristä kielentutkimus- 
ta, jossa pääasiallisena aineistona toimivat yksittäiskielten kielioppi- 
kuvaukset sekä rinnakkaiskorpukset tai kyselyaineistot. Pääasiallisena 
teoreettisena lähtökohtana on funktionaalinen ja käyttöpohjainen lähes- 
tymistapa kieleen. Kielitypologia kehittää menetelmiä erilaisten ihmis- 
kielten vertailuun ja tuottaa uutta perustietoa ihmiskielten luonteesta ja 
kielten variaatiosta. 


Katso myös: 

Luku 12 Kielikontaktien tutkimus 

Luku 13 Kielten dokumentointi ja kieliopin kuvaus 
Luku 15 Historiallinen ja vertaileva kielentutkimus 


Luku 17 Kieliopin tutkimus ja kielioppiteoriat 
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1. Johdanto 


Tässä artikkelissa pureudumme kielitypologian teoriataustaan ja 
metodologisiin ratkaisuihin." Kielitypologia vertailee maailman kieliä 
usein hyvinkin laajojen otosten pohjalta ja pyrkii tätä kautta ymmärtä- 
mään kielten ominaisuuksia ja kielen olemusta. Se on siis teoreettista 
kielitiedettä, jonka empiirinen perusta on maailmanlaajuisessa kielten 
vertailussa. Keskeisiä kysymyksiä kielitypologille ovat: Mikä on maail- 
man kielille yhteistä — universaalia — ja miten kielet eroavat toisistaan; 
siis mitkä ovat kieltenvälisen variaation rajat? Mikä on yleistä ja mikä 
harvinaista maailman kielissä? Millaisia yhteyksiä eli korrelaatioita eri 
kielenpiirteiden välillä voidaan havaita (kielenpiirteen määrittelystä ks. 
luku 3.4.)? Miten eri rakennetyypit jakautuvat maantieteellisesti? Ku- 
ten millä tahansa muulla (kieli)tieteen alalla näihin kaikkiin kysymyk- 
siin lisätään myös soveltuva miksi-kysymys, eli pyritään selittämään ja 
ymmärtämään tehtyjä kieltenvälisiä havaintoja ja yleistyksiä. Nimitys 
typologia, joka juontaa juurensa tutkimusalan historiaan, korostaa ehkä 
liiaksikin luokittelun merkitystä — luokittelu on yksi typologisen tutki- 
muksen vaihe ja osatavoite matkalla ymmärrykseen ihmiskielestä. 
Varsinainen kielitypologinen tutkimus on nimenomaan laajoihin 
kieliotoksiin pohjautuvaa tutkimusta. Väljemmin ymmärrettynä typo- 
logista tai typologisesti suuntautunutta tutkimusta voidaan kuitenkin 
tehdä myös suppeamman kielten vertailun pohjalta tai vaikkapa yksit- 
täistä kieliryhmää tai kieltä typologisesta näkökulmasta tarkastellen. Täs- 
sä artikkelissa keskitymme ensisijaisesti laajaan vertailuun perustuvan 
typologisen tutkimuksen metodeihin. Suomeksi kielitypologian metodo- 
logiasta, erityisesti kielten vertailtavuuden problematiikan kannalta, on 
aiemmin kirjoittanut Miestamo (2013); käsillä olevassa artikkelissa laa- 
jennamme näkökulmaa ja omistamme enemmän tilaa tutkimusproses- 
sin muille vaiheille, mm. aineiston keruulle kielten laajassa vertailussa. 
Periaatteessa mitä tahansa kielen ilmiötä voidaan lähestyä laajasta 
vertailevasta näkökulmasta. Käytännössä eniten typologista tutkimusta 
on tehty kieliopin keskeisistä osa-alueista, kuten kielten morfologisista 
ominaisuuksista, sanajärjestyksestä, lauseen osallistujien merkinnästä 
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ja tempus-, aspekti- ja moduskategorioista. Tällaisia ilmiöitä on metodo- 
logisesti helpompi lähestyä, koska niistä yleensä löytyy tietoa hyvinkin 
suuresta määrästä kieliä. Kielten peruskuvaukset käsittelevät useimmi- 
ten ainakin tällaisia keskeisiä kieliopin osa-alueita. On siis luonnollis- 
ta, että kielitypologinen tutkimus on lähtenyt liikkeelle näistä ilmiöistä. 
Foneettinen ja fonologinen tutkimus on perinteisesti aina ollut kielten- 
välisesti orientoitunutta, vaikka sitä onkin harjoitettu jossain määrin 
erillään varsinaisesta kielitypologisesta tiedeyhteisöstä. Nyttemmin fo- 
nologinen typologia on enenevässä määrin integroitumassa typologian 
muuhun kenttään. Myös leksikaalinen typologia eli sanamerkitysten ja 
leksikon ominaisuuksien laaja kieltenvälinen vertailu on viime aikoina 
saanut kasvavaa huomiota typologiassa. Sellaisia kielen ilmiöitä, joiden 
kieltenvälinen vertailu vaatii typologilta yksittäisten kielten aineiston sy- 
vällistä analyysia, on vaikeampi tarkastella laajasta typologisesta näkö- 
kulmasta. Niinpä esimerkiksi erilaisten diskurssi-ilmiöiden typologi- 
nen tutkimus on vielä lapsenkengissään. Hyvän kuvan kielitypologiassa 
perinteisesti käsitellyistä aihepiireistä antaa tutustuminen teoksen The 
World Atlas of Language Structures verkkoversioon osoitteessa https:// 
wals.info (Dryer & Haspelmath 2013). 

Yleinen kielitiede pyrkii tekemään kaikkia kieliä koskevia yleistyksiä. 
Laajamittaista kielten vertailua harjoittava kielitypologia on näin ylei- 
sen kielitieteen kentän keskiössä. Kaikkia kieliä koskevia yleistyksiä ei 
voida tehdä yhden tai vain muutaman kielen aineiston pohjalta. Ylei- 
sesti maailman kieliin soveltuvia teorioita ja metodeja ei voida kehit- 
tää ottamatta huomioon kieltenvälistä variaatiota maailmanlaajuisessa 
perspektiivissä. Niillekin tutkimusasetelmille, joissa empiirinen perusta 
ei käsitä laajaa kielten vertailua, on tärkeää ottaa huomioon kielitypo- 
logiassa tehdyt havainnot ja eri kielistä löytyvät ilmiöt. Kielitypologia 
ruokkii näin teorianmuodostusta kielitieteen eri aloilla. Laajemmassa 
tieteidenvälisessä kontekstissa voidaan todeta, että pyrkiessään kaikkia 
kieliä koskeviin yleistyksiin yleinen kielitiede — ja erityisesti kielitypo- 
logia — on tärkeä osa sitä monimutkaista palapeliä, jota tieteentekijät 
kokoavat ymmärtääkseen ihmismieltä ja ihmisen toimintaa. 

Kielitypologian ja yksittäiskielten tutkimuksen välillä vallitsee riip- 
puvuussuhde ja hedelmällinen vuorovaikutus. Toisaalta kielitypologit 


LUKU 14 KIELITYPOLOGIAN MENETELMÄT 641 


ovat riippuvaisia yksittäiskielten tutkijoiden tuloksista voidakseen yli- 
päätään vertailla kieltä. Toisaalta yksittäiskielten tutkijat hyötyvät typo- 
logisesta tiedosta, joka auttaa ymmärtämään yksittäiskielen ilmiöitä 
laajemmassa kontekstissa ja antaa näin eväitä analyysien hiomiselle ja 
aineiston uudelleentulkinnalle. Mitä tahansa kielen ilmiötä yksittäisessä 
kielessä tai kieliryhmässä tutkiessaan kannattaa aina tutustua vastaaviin 
ilmiöihin muissa kielissä, ja mikäli ilmiöstä on olemassa typologista 
tutkimusta, se tarjoaa helpoimman pääsyn tällaiseen kieltenväliseen 
tietoon. Pyrimme tässä artikkelissa valottamaan typologian teoreettista 
ja metodologista taustaa, ei pelkästään niille, joiden oma tutkimus on 
typologista luonteeltaan, vaan myös niille, jotka käyttävät typologian tut- 
kimustuloksia oman yksittäisiä kieliä koskevan tutkimuksensa taustal- 
la. Tutustuminen typologian teoreettis-metodologisiin taustoihin auttaa 
ymmärtämään typologisen tiedon luonnetta syvällisemmin. 

Artikkeli etenee seuraavasti. Luvussa 2 luomme lyhyen katsauksen 
kielitypologian historiaan ja historialliseen taustaan sekä muutamiin 
keskeisiin teoreettisiin kysymyksiin. Luvussa 3 tarkastelemme typo- 
logisia tutkimusprosesseja: vertailuperustaa, otoskielten valintaa, luo- 
kittelua, jakaumien tarkastelua, kielenpiirteiden välisiä korrelaatioita ja 
tulosten selittämistä. Luvussa 4 pohdimme lyhyesti typologian paikkaa 
kielitieteen kentällä suhteessa lähialoihin sekä teemme lyhyen yhteen- 
vedon artikkelin teemoista. 


2. Kielitypologian historiaa ja teoreettista 
taustaa 


2.1. Katsaus kielitypologian historiaan 

Kielten systemaattinen ja laajamittainen vertailu on lähestymistapana 
suhteellisen nuori. Se alkoi varsinaisesti Joseph Greenbergin tutki- 
muksista 1960-luvulla. Kaikkien kielten yhteyttä etsivä universalisti- 


nen ajattelu on sen sijaan paljon vanhempaa perua eurooppalaisessa 
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kontekstissa. Se juontaa juurensa jo antiikin ajattelijoihin, ja omat uni- 
versaalikielioppimallinsa ovat myöhemmin esittäneet mm. modis- 
tien nimellä tunnettu koulukunta myöhäiskeskiajalla sekä Port Royal 
-koulukunta, joka vaikutti 1600-luvulla Ranskassa (ks. Itkonen 1991). 
Yhteistä näille historiallisille suuntauksille on, että universaaleista pää- 
määristä huolimatta tarkastelu on rajoittunut lähinnä kulloiseenkin 
valtakieleen. Tässä mielessä ne vertautuvat suoraan chomskylaiseen 
generatiiviseen kielioppiin, joka nykysuuntauksista ehkä selvimmin 
perustaa olettamuksensa kielen universaaleista ominaisuuksista yhden 
(tai korkeintaan muutaman) kielen analyysille. Kielitypologian lähtö- 
kohta on täysin vastakkainen: tutkittaessa maailman kielten erilaisuutta 
ja samuutta on empiirisen aineiston katettava maailman kielten kirjo 
mahdollisimman laaja-alaisesti ja tasaisesti. 

Kielten vertailusta alettiin kiinnostua enenevässä määrin 1800-luvulle 
tultaessa. Keskeisimpiä huomion kohteita oli kielten morfologinen ra- 
kenne. Klassinen morfologinen typologia, jonka näkyvimpiä edustajia 
olivat mm. August (1767-1845) ja Wilhelm (1772-1829) von Schlegel 
sekä Wilhelm von Humboldt (1767-1835), jakoi kielet kolmeen perus- 
tyyppiin: isoloiviin kieliin, joissa ei ole sidonnaista morfologiaa lainkaan 
eli kukin sana koostuu yhdestä morfeemista, sekä agglutinoiviin ja fu- 
sionaalisiin kieliin, joissa molemmissa sanat sisältävät affikseja, mutta 
edellisissä vartaloiden ja affiksien muodoissa ei ole vaihtelua, kun taas 
jälkimmäisissä esiintyy erilaisia morfofonologisia ilmiöitä. Myöhem- 
min näihin kolmeen perustyyppiin lisättiin vielä neljäs eli polysyn- 
teettiset kielet, joissa affiksien määrä sanassa on huomattavan suuri 
ja yksi sana voi äärimmillään vastata pitkääkin lausetta kolmen muun 
tyypin kielissä. Huomattakoon, että kun puhuttiin kielityypeistä eikä 
rakennetyypeistä, ajatuksena oli, että kielen morfologinen tyyppi luon- 
nehtisi kieltä yleisellä tasolla. Tuon ajan typologiseen ajatteluun liittyi 
myös etnopsykologinen ote, jossa kielen tyypin ajateltiin heijastelevan 
puhujayhteisön kulttuurista kehitysastetta ja ajattelutapaa. 1800-luvun 
lopulla ja 1900-luvun alkupuoliskolla kiinnostus typologiseen vertailuun 
oli vähäisempää; 1800-luvulla dominoi historiallis-vertaileva kielitiede, 
ja 1900-luvulla siirryttiin vähitellen strukturalismiin. Typologista ajat- 
telua veivät kuitenkin strukturalismin rinnalla eteenpäin esimerkiksi 
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Edward Sapir (1884-1939), joka kehitti mm. morfologisen typologian 
luokitteluita analyyttisempaan suuntaan tunnistamalla erillisiä paramet- 
rejä aiemmin yhtenäisempinä esitettyjen morfologisten tyyppien takana 
(ks. Sapir 1921), sekä Roman Jakobson (1896—1982) ja muutamat muut 
Prahan koulukunnan edustajat. 

Kiinnostus kielten vertailuun ja kielten universaaleihin ominaisuuk- 
siin heräsi toden teolla 1960-luvulla, kun Joseph Greenberg (1915—2001) 
toi laajan systemaattisen kielten vertailun metodit kielitieteeseen. Frään- 
laisena lähtölaukauksena laajempaan tietoisuuteen voidaan pitää Dobbs 
Ferryssä vuonna 1961 järjestettyä konferenssia Universals of Language, 
johon Greenberg oli kutsunut useita tunnettuja kielitietelijöitä ja lähi- 
alojen edustajia. Tuon konferenssin pohjalta toimitetussa kirjassa il- 
mestyi Greenbergin (1963) artikkeli ”Some universals of grammar with 
particular reference to the order of meaningful elements”, joka loi poh- 
jan systemaattiseen kielen vertailuun perustuvalle typologiselle metodo- 
logialle ja greenbergiläiselle universaalikäsitykselle. Vuosina 1967-1976 
Greenberg johti Stanfordissa Universals of Human Language -projektia, 
jonka tulokset on vedetty yhteen neliosaisessa kirjasarjassa Universals 
of Human Language (Greenberg 1978). Näiden tapahtumien myötä mo- 
derni kielitypologia oli saanut alkunsa (Greenbergistä ks. tarkemmin 
Miestamo 2010). 

Myöhemmistä kielitypologian kehityksen virstanpylväistä mainitta- 
koon seuraavat. 1990-luvulla EU:n rahoittaman EUROTYP-projektin 
tuloksena syntyi kokoelma kirjoja, joissa kartoitettiin laajasti Euroopan 
kielten ominaisuuksia kieliopin eri osa-alueilla. Euroopan kieliä tarkas- 
teltiin maailmanlaajuisessa typologisessa perspektiivissä, joten samalla 
tehtiin laajempaakin typologista tutkimusta. Vuonna 1994 perustettu 
Association for Linguistic Typology aloitti säännöllisen konferenssi- 
sarjansa vuonna 1995 ja alkoi julkaista Linguistic Typology -lehteä vuonna 
1997. Leipzigin evoluutioantropologian Max Planck -instituutissa vuon- 
na 1997 aloittanut kielitieteen laitos muodostui merkittäväksi kielitypo- 
logisen tutkimuksen keskukseksi — Max Planckin politiikan mukaisesti 
laitos lakkautettiin vuonna 2015 sen johtajan Bernard Comrien jäädessä 
eläkkeelle. Vuonna 2005 ilmestyi edellä mainittu, noin 40 kirjoittajan 
yhteistyönä maailman kielten ominaisuuksia kartoittava The World Atlas 
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of Language Structures (WALS) (Haspelmath, Dryer, Gil & Comrie 2005). 
WALS on näkyvä esimerkki siitä viimeaikaisesta kehityksestä, jossa 
kielten ja kielenpiirteiden maantieteelliseen levinneisyyteen liittyvät ky- 
symykset ovat enenevässä määrin nousseet kielitypologian keskiöön. 
Moderni kielitypologia syntyi 1960-luvulla vastaamaan kysymykseen 
kieltenvälisen variaation rajoista ja kielten universaaleista eli siitä, mil- 
laiset kielet ovat mahdollisia ja millaiset eivät ja miten tätä kieltenvälistä 
variaatiota voidaan selittää (etupäässä) funktionaalisesti. Vuosituhannen 
vaihteen jälkeen on yleistynyt Johanna Nicholsin (1992) klassikkoteok- 
sesta lähtölaukauksensa saanut populaatiotieteellinen näkökulma, jos- 
sa rakennetyyppien levinneisyyttä tarkastellaan populaatioina. Bickelin 
(2007) sanoin kysymys ”mikä on kielessä mahdollista?” on saanut seu- 
rakseen kysymykset ”mitä, missä ja miksi?”. Siinä missä ennen otan- 
nassa pyrittiin eliminoimaan kielisukulaisuuteen ja kielikontakteihin 
perustuvat yhtäläisyydet, jotta päästäisiin käsiksi kielen perimmäisiin 
ominaisuuksiin, nykyisin areaalinen ja genealoginen näkökulma ovat it- 
sessään usein mukana typologisessa tutkimuksessa, ja tyyppien yleisyyt- 
tä ja levinneisyyttä halutaan ymmärtää niiden taustalla olevien historial- 
listen prosessien kautta (ks. tarkemmin Bickel 2007; ks. Kielikontaktien 


tutkimus tässä kirjassa). Palaamme näihin eri suuntauksiin luvussa 3. 


Kielitypologian historiasta voi lukea lisää esimerkiksi Ramatin (2010) ja 
Graffin (2010) katsausartikkeleista. 

Suomalaisen kielitieteen kontekstissa voidaan typologisesti orien- 
toituneen tutkimuksen varhaisia juuria nähdä jo 1800-luvulla Anders 
Sjögrenin ja Matthias A. Castrenin itään suuntautuneissa tutkimus- 
matkoissa (ks. myös Antropologinen lingvistiikka tk.). Ne aloittivat kan- 


sainvälisesti uraauurtavan etnolingvistisen tradition, jossa tarkasteltiin 
ja vertailtiin eurooppalaisista kielistä typologisesti monella tavalla poik- 
keavia kieliä ja kulttuureita. Tuloksena syntyi valtavasti typologisesti 
kiinnostavaa aineistoa pohjoisen Euraasian kielistä. Vertailu oli kuiten- 
kin päämääriltään ensisijaisesti historiallis-vertailevaa, ei typologista. 
Fennougristiikassa ja fennistiikassa diakroninen näkökulma dominoi 
aina 1960-luvulle asti. Modernin typologian aikakaudella typologinen 
näkökulma alkoi rantautua Suomeen. Mikko Korhosen tuotannossa 
kielitypologinen näkökulma oli vahvasti läsnä (ks. Salminen 1996). 
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Yllämainittuun EUROTYP-hankkeeseen osallistui suomalaisista kieli- 
tieteilijöistä mm. Marja Leinonen, Jouko Lindstedt, Hannu Tommola 
ja Maria Vilkuna. Turun yliopiston yleisen kielitieteen oppiaineessa Esa 
Itkonen ja Anneli Pajunen toivat typologista näkökulmaa vahvasti esil- 
le (ks. Pajunen 1998; 2000; Itkonen 1997). Pirkko Suihkonen pohti 
väitöskirjassaan (1990) korpustutkimuksen mahdollisuuksia kielitypo- 
logiassa. Ensimmäisiä varsinaisia laajoihin otoksiin perustuvia typologi- 
sia tutkimuksia olivat Seppo Kittilän transitiivisuutta (2002) käsittelevä 
ja Matti Miestamon negaatiota (2000; 2003) käsittelevä tutkimus. Kvan- 
titatiivista näkökulmaa suomalaiseen kielitypologiaan on tuonut erityi- 
sesti Kaius Sinnemäki (2008; 2011). Annu Marttilan (2010) leksikaalista 
ikonisuutta lintujen nimissä tarkastelevaa laajaa vertailevaa tutkimusta 
voidaan pitää leksikaalisen typologian alaan kuuluvana. Myös Ksenia 
Shagalin (2019) tuore tutkimus partisiippien typologiasta on herättänyt 
kansainvälistä huomiota. 


2.2. Teoreettista taustaa 


Ylempänä typologiaa on luonnehdittu maailmanlaajuiseksi vertailevaksi 
kielitieteeksi ja teoreettiseksi kielitieteeksi, jonka empiirinen perusta on 
maailmanlaajuisessa kielten vertailussa. Nämä luonnehdinnat sinällään 
eivät vielä kerro paljoakaan siitä, millaisia teoreettisia taustaoletuksia 
typologisella tutkimuksella on. Toki empiirinen metodologinen lähes- 
tymistapa asemoi typologian rationalismi-empirismijaottelussa empi- 
rismin puolelle. Periaatteessa laajaan vertailuun perustuvaa typologista 
tutkimusta voidaan tehdä hyvinkin erilaisista teoreettisista lähtökohdis- 
ta. Tavallisimmin kuitenkin typologista tutkimusta harjoitetaan funktio- 
nalistisessa viitekehyksessä. Myöskään formaaleja metakieliä ei yleensä 
käytetä, vaan analyysit esitetään mahdollisimman laajasti ymmärretyn ja 
jaetun käsitteistön puitteissa. Typologinen vertailu on luonteeltaan synk- 
ronista, mutta diakroninen näkökulma on vahvasti läsnä typologisessa 
tutkimuksessa, etenkin typologisten havaintojen selittämisessä. Keskei- 
nen teoreettinen kysymys on myös yksittäiskielten ja universaalin suhde 
ja kielellisten kategorioiden luonne kielikohtaisina vs. universaaleina 
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sekä edelleen se, miten erilaiset kategoriakäsitykset vaikuttavat kielen 
vertailtavuuteen konkreettisen metodin tasolla. Tässä luvussa luomme 
lyhyen katsauksen kielitypologian keskeiseen teoreettiseen taustaan. 
Kun eri lähestymistapoja kieleen ja kielioppiin luonnehditaan teo- 
reettisen lähestymistavan mukaan joko formalistisiksi tai funktionalis- 
tisiksi, typologia identifioituu yleensä selvästi jälkimmäiseen ryhmään 
(ks. Johdannon luku 3 tk.). Kuten yllä todettiin, laajaa vertailua voidaan 


toki tehdä monenlaisissa teoriakehyksissä, ja esimerkiksi generatiivi- 
nen kielitiede on viime aikoina alkanut kiinnittää enemmän huomiota 
kieltenväliseen evidenssiin. Laajat vertailevat tutkimukset tällaisista for- 
malistisista lähtökohdista ovat kuitenkin harvinaisia. Yleensä typologien 
keskeisenä teoreettisena lähtökohtana on, että kielen funktio, kielen- 
käyttö, vaikuttaa kielen rakenteeseen, ja näin selityksiä kieltenvälisille 
yleistyksille etsitään ensisijaisesti funktion tasolta eli semantiikasta, 
pragmatiikasta ja kognitiivisista prosesseista. Jo Greenbergillä (1966) oli 
vahvasti käyttöpohjainen näkemys kielestä, mistä selkeimpänä esimerk- 
kinä on se, että hän nosti erityisesti ilmiöiden frekvenssin tärkeäksi se- 
littäväksi tekijäksi. Typologian selitysperusteisiin palaamme luvussa 3.7. 

Kielten laajahkoa vertailua harjoittavat myös historiallis-vertailevan 
kielitieteen edustajat. Typologinen vertailu eroaa tästä tavoitteidensa 
osalta: typologiassa vertailun päämäärä ei ole päästä kiinni kielten his- 
torialliseen kehitykseen ja sukulaisuussuhteisiin vaan kuvata kielten- 
välistä variaatiota ja ymmärtää ihmiskielen perusperiaatteita laajan 
vertailun pohjalta. Typologia on siis ensisijaisesti synkronista, siinä 
missä historiallis-vertailevan kielitieteen tavoitteet ovat lähtökohtaisesti 
diakroniset. Diakronialla on kuitenkin keskeinen rooli typologiassa. Jo 
Greenberg (1978) puhui dynaamisesta typologiasta ja tarkasteli mm. 
sitä, millaiset muutokset rakennetyypistä toiseen ovat mahdollisia, ja 
tällaiset kysymyksenasettelut ovat tulleet entistä tärkeämmiksi makro- 
tason synkronisten jakaumien selittäjinä. Havaittujen rakennetyyppien 
jakaumien selittämisessä on oleellista katsoa niiden historiallisen kehi- 
tyksen yksityiskohtia ja tyypillisiä kieliopillistumiskehityksiä. Vaikka itse 
vertailu onkin yleensä synkronista, typologisissa tutkimuksissa on usein 
vahva diakroninen komponentti mukana. Kielen funktionaaliset aspektit 
vaikuttavat kielen muotoon ja rakenteeseen historiallisten prosessien 
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kautta, ja typologien selitysmalleissa yhdistyvät näin historialliset ja 
funktionaaliset selitykset. 

Typologiassa, kuten myöskään deskriptiivisessä kielitieteessä (ks. Kiel- 
ten dokumentointi ja kieliopin kuvaus tk.), ei yleensä käytetä teoriaspe- 
sifejä, formalisoituja metakieliä. Sen sijaan analyysit esitetään käyttäen 


sellaista terminologiaa, joka on kielitieteilijöiden keskuudessa mahdol- 
lisimman laajalti jaettua ja ymmärrettyä. Dixon (1997; 2009) ja Dryer 
(2006) ovat esittäneet, että tällaista yhteistä teoriapohjaa voidaan kutsua 
peruskielioppiteoriaksi (engl. Basic Linguistic Theory, BLT). Peruskielioppi- 
teorialla on juurensa perinteisessä kieliopissa, jonka päälle se on eri ai- 
kakausien kielitieteellisen tutkimuksen tuloksia hyödyntäen rakentanut 
modernin, eri kielten ilmiöiden analyysiin ja kuvaukseen laajalti soveltu- 
van käsitteistön ja terminologian. Peruskielioppiteoria on yhteinen, ku- 
mulatiivinen teoriapohja, jonka osaksi pääsee kulloinkin vallalla olevista 
teorioista käsitteitä, jotka osoittautuvat kestäviksi ja hyödyllisiksi; jotkin 
käsitteet taas elävät vain lyhyen aikaa eivätkä päädy osaksi peruskielioppi- 
teoriaa. Nykyisin peruskielioppiteoria mainitaan usein eksplisiittisesti 
teoriataustaksi typologisissa tutkimuksissa ja deskriptiivisissä kieliopeissa. 

Keskustelussa typologisen vertailun teoreettisista lähtökohdista on 
viime aikoina noussut keskeisenä teemana esiin pohdinta kielellisten 
kategorioiden luonteesta: ovatko kielelliset kategoriat kielille yhteisiä vai 
kielikohtaisia. Universalistinen kategoriakäsitys olettaa kaikille kielille 
yhteisten kategorioiden olemassaolon, kun taas partikularistinen käsi- 
tys pitää kielellisiä kategorioita kielikohtaisina. Edellisen mukaan siis 
sellaiset kategoriat kuin vaikkapa adjektiivi, subjekti tai genetiivi olisivat 
kielille yhteisiä ja kunkin yksittäisen kielen kategoriat olisivat näiden 
yhteisten kategorioiden kielikohtaisia reaalistumia. Jälkimmäinen kä- 
sitys taas olettaa, että kategorioita ei kieltenvälisessä merkityksessä ole 
olemassa, vaan ne ovat aina kielikohtaisia. Universalistinen kategoria- 
käsitys on vallalla nykykielitieteessä varsinkin erilaisten formalististen 
kielioppimallien kannattajien parissa. Niistä erityisesti mainittakoon 
chomskylainen generativismi, jossa kategoriat ovat synnynnäisen uni- 
versaalikieliopin määräämiä. Myös esimerkiksi perinteinen, antiikin 
kielitieteestä juurensa juontava ja 1800-luvulle asti yleinen tapa kuva- 
ta eri kieliä latinan mallin mukaisesti voidaan nähdä universalistisena 
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lähestymistapana. Partikularistinen kategoriakäsitys on ollut erityisen 
näkyvä 1900-luvun alkupuolen amerikkalaisessa antropologisessa 
kielitieteessä ja strukturalismissa, jossa tutkijat saivat tarkasteltavak- 
seen valtavan kirjon eurooppalaisista kielistä radikaalistikin poikkeavia 
kieliä; reaktio tähän kielten moninaisuuteen oli Martin Joosin (1957, 
96) sanoin näkemys, että ”kielet voivat erota toisistaan rajattomasti 
ja ennustamattomasti”.? Chomskylaisen generativismin nousu käänsi 
valtavirta-ajattelua vahvasti universalistiseen suuntaan, mutta viime 
vuosikymmeninä funktionalistisessa kielitieteessä ja etenkin typologias- 
sa on otettu jälleen eksplisiittisesti partikularistisia kantoja (ks. esim. 
Lazard 1992; Dryer 1997; Haspelmath 2007). Funktionaalis-typologinen 
partikularistinen näkemys ei kuitenkaan oleta aiempien amerikkalaisten 
strukturalistien tavoin, että kielten välinen variaatio olisi satunnaista. 
Kategoriat ovat kielikohtaisia, mutta niiden välillä on yhtäläisyyksiä ja 
samankaltaisuutta, jonka taustalla on kielille yhteinen funktionaali- 
nen taso — merkitys, käyttö ja kommunikaatiotarpeet. Tutkijan käsitys 
kategorioiden luonteesta vaikuttaa suoraan vertailun metodologisiin pe- 
rusteisiin, joihin palataan seuraavassa luvussa. 


3. Typologinen tutkimusprosessi 


Tässä luvussa tarkastelemme lähemmin typologisen tutkimusprosessin 
eri vaiheita. Funktionalistis-typologinen tutkimusprosessi voidaan tyypil- 
lisesti tiivistää alla olevaan seitsemään eri vaiheeseen (soveltaen Stassen 
1985, 1-23; Miestamo 2013). Tässä esitettyjä vaiheita edeltää luonnolli- 
sesti tutkimuksen tavoitteiden ja tutkimuskysymysten määrittely (su- 
luissa luku, jossa käsittelemme kyseistä tutkimusprosessin vaihetta). 


1) Typologisen tutkimusprosessin vaiheet 
I. Aineiston koonti 
1. Määritellään tutkimuksen kohde (3.1.) 
2. Valitaan kieliotos (3.2.) 
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3. Hankitaan tutkimusmateriaali (3.3.) 
II. Aineiston analyysi ja yleistysten tekeminen 
1. Analysoidaan ja luokitellaan materiaali (3.4.) 
2. Kuvaillaan rakennetyyppien yleisyys ja maantieteellinen ja- 
kauma (3.5.) 
3. Selvitetään tilastolliset korrelaatiot (3.6.) 
III. Tulosten selittäminen (3.7.) 


Tämä representaatio on toki yksinkertaistus käytännön työstä. Tutkimus 
ei useinkaan etene näin suoraviivaisesti, vaan eri vaiheita voidaan työs- 
tää samanaikaisesti tai aiempiin vaiheisiin voidaan joutua palaamaan 
useamman kerran. Analyysi- ja luokitteluvaiheessa saatetaan palata 
materiaalin keräämiseen, jos alkuperäinen lähde ei ollut riittävä esiin 
nousseiden kysymysten ratkaisemiseksi. Jos analyysivaiheessa lähde- 
materiaali osoittautuu muutoinkin riittämättömäksi, typologi voi joutua 
vaihtamaan otoskielen ja täten palaamaan otantavaiheeseen. Joskus ana- 
lyysivaiheessa täytyy myös tarkentaa itse tutkimuskohteen määrittelyä, 
jos se ei ole osoittautunut riittävän tarkaksi. Seuraavassa kuvaamme tut- 
kimusprosessia vaihe vaiheelta. 


3.1. Tutkimuskohteen määrittely 


Typologinen tutkimus lähtee liikkeelle tutkimuskohteen määrittelystä. 
Oleellinen kysymys on, miten tunnistaa tutkimuksen kohteena oleva 
ilmiö hyvinkin erilaisissa kielissä, jotta vertailu kohdistuu samaan il- 
miöön vertailtavissa kielissä. Tätä ongelmaa kutsutaan typologisessa kir- 
jallisuudessa kieltenvälisen identifikaation ongelmaksi (ks. esim. Stassen 
2010). Edellisessä luvussa totesimme, että typologisen tutkimuksen 
yleinen teoreettinen taustaoletus on, että kielelliset kategoriat ovat kieli- 
kohtaisia, siis kategoriakäsitys on partikularistinen. Kun kielille yhteisiä 
kategorioita ei ole olemassa, ei vertailtavan tutkimuskohteen määrittelyä 
voida perustaa sellaisille. 

Jo varhain todettiin, että kielellisen vertailun perustaminen puhtaasti 
muodollisiin kategorioihin on ongelmallista (Greenberg 1963; Stassen 
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1985). Mikäli halutaan vertailla eri kielten adjektiiveja, ei niitä voida tun- 
nistaa sellaisten yhdestä tai muutamasta kielestä peräisin olevien muo- 
dollisten kriteerien avulla kuin että niillä on morfologisesti ilmaistut ver- 
tailuasteet positiivi (hyvä), komparatiivi (parempi) ja superlatiivi (paras), 
että ne tarvitsevat predikaatteina toimiessaan olla-verbin (esim. Erkki 
on pitkä) ja että ne voivat esiintyä intensifikaattorien, kuten erittäin ja 
sangen, kanssa. Ominaisuussanojen ilmaisussa on paljon kieltenvälistä 
variaatiota, ja tällainen muotoon perustuva määritelmä jättää ulko- 
puolelleen esimerkiksi ne lukuisat kielet, joissa ominaisuussanojen ver- 
tailu toteutetaan muuten kuin morfologisesti tai joissa ominaisuussanat 
eivät ole nomineja vaan toimivat syntaktisesti kuten verbit. Jo varhain 
siis havaittiin, että kieltenvälisen vertailun on tavallisesti perustuttava 
muodon sijasta funktioon (ks. Stassen 2010; Miestamo 2013). 

Tätä metodologista käytäntöä on viime aikoina kirkastanut Haspelmathin 
(2010) eksplikoima kuvauskategorioiden (engl. descriptive categories) ja 
vertailukäsitteiden (engl. comparative concepts) välinen eronteko. Kuvaus- 
kategorioiden kohteena ovat yksittäisten kielten kielikohtaiset kategoriat, 
joiden semanttiset ja morfosyntaktiset ominaisuudet ovat kullekin 
kielelle uniikkeja. Nämä ovat osa kunkin kielen systeemiä, ja ne ovat 
psykologisesti ja sosiaalisesti tosia siinä mielessä, että ne ovat olemassa 
kunkin kielen puhujayhteisön jakamina konventioina. Kielentutkijan 
esittämien kuvauskategorioiden psykologinen ja sosiaalinen totuus puo- 
lestaan riippuu siitä, miten hyvin tutkija on onnistunut tiivistämään to- 
dellisuuden esittämiinsä kategorioihin. Vertailukäsitteet sen sijaan ovat 
tutkijan metodologisia työkaluja, joiden tavoitteena on toimia kielten- 
välisten yleistysten välineenä, eikä niillä ole suoraa relevanssia minkään 
yksittäisen kielen kuvaukselle. Epäsuorasti ne toki voivat olla hyvinkin 
relevantteja — kuten alussa totesimme, typologisesta tiedosta on paljon 
hyötyä kielenkuvauksen prosessissa (ks. myös luku 4). Siinä missä tut- 
kijan esittämät kuvauskategoriat voivat olla oikeita tai vääriä suhteessa 
kunkin kielen todellisiin kielikohtaisiin kategorioihin, vertailukäsitteet 
eivät ole samanlaisessa suhteessa todellisuuden kanssa. Metodologisina 
työkaluina niitä arvioidaan ensisijaisesti sen mukaan, miten hyvin ne 
soveltuvat kulloisenkin tutkimuskysymyksen selvittelyyn, esimerkiksi 
miten selkeästi ja luotettavasti vertailukäsite rajaa tutkittavan ilmiön 
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hyvinkin erilaisista otoskielistä ja missä määrin sen määritelmään pe- 
rustuva tutkimus tuottaa teoreettisesti kiinnostavia tuloksia. 

Kielten kategoriat ovat kielikohtaisia, mutta niiden välillä voidaan ha- 
vaita paljonkin samankaltaisuutta. Funktionalistisessa teoriakehyksessä 
kielten kategorioiden samankaltaisuuden nähdään perustuvan kielten 
keskenään jakamiin funktionaalisiin ominaisuuksiin. Kieltenvälinen 
vertailu pohjaa näin ollen ensisijaisesti universaalin tason semanttisiin 
ja pragmaattisiin funktioihin, joita voidaan lisäksi tarkentaa muotoon 
liittyvillä kriteereillä. Haspelmathin (2010, 670) mukaan vertailukäsit- 
teiden määrittelyssä voidaan käyttää kolmenlaisia käsitetyyppejä: 


— konseptuaalis-semanttiset käsitteet (esim. ominaisuus alla olevan 
laatikon esimerkkimääritelmässä) 

— yleiset muodolliset käsitteet (esim. edeltävä määriteltäessä esim. 
prepositiota) 

- muut vertailukäsitteet (esim. lekseemi alla olevan laatikon esimerkki- 
määritelmässä). 


Laatikon esimerkki havainnollistaa vertailukäsitteen määrittelyä. 


Esimerkki: 
Haspelmath (2010, 670) määrittelee vertailukäsitteen adjektiivi seuraavasti: 


Adjektiivi on lekseemi, joka merkitsee deskriptiivistä ominaisuutta ja 
jota voidaan käyttää rajoittamaan substantiivin tarkoitetta. 


Määritelmässä esiintyvät vertailukäsitteet lekseemi ja substantiivi sekä 
konseptuaalis-semanttiset käsitteet deskriptiivinen ominaisuus ja rajoit- 
taa tarkoitetta. Tämä määritelmä rajaa ulkopuolelle esimerkiksi sanat 
kauneus ja koko, jotka ovat kyllä lekseemejä ja viittaavat ominaisuuteen 
mutta joita ei käytetä substantiivin määritteenä rajaamaan sen tarkoitet- 
ta. Määritelmä rajaa ulkopuolelle myös konstruktion joka oli kaunis, joka 
kyllä viittaa ominaisuuteen ja rajaa substantiivin tarkoitetta mutta joka 
ei ole lekseemi vaan relatiivilause. 


652 MATTI MIESTAMO JA KAIUS SINNEMÄKI 


Kieltenvalisen identifikaation ongelma ja kielten vertailtavuus ovat kes- 
keisimpiä metodologisia kysymyksiä kielitypologiassa. Emme kuiten- 
kaan kirjoita niistä tässä tämän pidemmin, koska Miestamon (2013) suo- 
menkielinen esitys aiheesta on avannut problematiikkaa konkreettisesti 
ja runsain esimerkein. 


3.2. Otanta 


Kun tutkimuskohde on määritelty, seuraava vaihe tutkimusprosessissa 
on valita kielet, joista tutkimusmateriaali kerätään ja analysoidaan. Fi 
ole kuitenkaan itsestään selvää, mitkä maailman noin 7 ooo kielestä 
pitäisi valita tutkimukseen. Kielten systemaattista valintaa ja siihen liit- 
tyviä periaatteita kutsutaan otannaksi, ja se on laajimmin käsitelty aihe 
typologisessa metodologiassa (ks. esim. Cysouw 2005, 554—555). Joskus 
eksploratiivisessa eli aiemmin heikosti tunnetun tai tuntemattoman il- 
miön kartoittavassa tutkimuksessa käytetään ns. mukavuusotantaa, eli 
kieliä otetaan mukaan tutkimukseen ilman systemaattisia otantaperiaat- 
teita, mutta tämä ei ole nähdäksemme suositeltavaa edes tutkimuksen 
pilottivaiheessa. Otannassa kielten valintaa siis rajoitetaan etukäteen eri- 
laisin periaattein, jotta saadun otoksen avulla voitaisiin tehdä yleistyksiä. 

Typologiassa käytetyt otantamenetelmät voidaan jakaa karkeas- 
ti kahteen luokkaan niiden tarkoituksen mukaan: variaatio-otantaan 
ja todennäköisyysotantaan. Variaatio-otantaa käytetään, kun pyritään 
kartoittamaan jonkin kielenpiirteen kieltenvälinen variaatio. Tällöin 
on tavoitteena saada mahdollisimman kattava käsitys vertailukäsitteen 
avulla määritellyn piirteen monimuotoisuudesta ja myös sen kaikkein 
harvinaisimmista ilmenemistyypeistä. Variaatio-otanta hyödyttää eten- 
kin kielioppiteorian validoimista: pätevän kielioppiteorian on kyettävä 
selittämään myös kaikkein harvinaisimmat kielenpiirteiden tyypit, ja ne 
löytyvät parhaiten variaatio-otannan avulla (Miestamo, Bakker & Arppe 
2016, 233—234). Todennäköisyysotantaa puolestaan käytetään univer- 
saalien tutkimuksessa, kun halutaan testata kielenpiirteen jakaumia 
tilastollisesti. Tällöin tavallinen lähestymistapa otantaan on satunnais- 
otanta. Klassiset tilastomenetelmät vaativat, että tutkimusyksiköillä, joka 
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typologiassa tarkoittaa yleensä kieliä, on sama todennäköisyys tulla va- 
lituksi otokseen; tähän tavoitteeseen päästään satunnaisotannan avulla. 
Lisäksi tutkimusyksiköiden pitäisi olla toisistaan riippumattomia. Toisis- 
ta kielistä riippuvat piirteet sotkevat tilastollisten päätelmien tekemistä, 
joten lähisukukielet ja lähinaapurit tulisi sulkea otoksen ulkopuolelle. 
Pohjimmiltaan otantamenetelmien valintaa ohjaa siis tutkimuksen 
tavoite. 

Riippumatta otantamenetelmästä typologisen otannan pääperiaattee- 
na on, että otos edustaisi perusjoukkoa (esim. tällä hetkellä puhuttavia 
maailman kieliä) ja sen monimuotoisuutta mahdollisimman tasaisesti 
ja kattavasti. Tyypillisesti kattavaan ja tasaiseen edustukseen pyritään 
käyttämällä ositettua otantaa (engl. stratified sampling), jonka avulla tun- 
nettuja vinoumia kielenpiirteiden jakaumissa pystytään rajoittamaan. 
Ositetussa otannassa kielet jaetaan ositteisiin, esim. kieliperheisiin ja 
maantieteellisiin alueisiin, joista kielet poimitaan otokseen — toden- 
näköisyysotannassa yleensä satunnaisotannalla. Ositus voidaan tehdä 
joko yhdellä tai useammalla tasolla, yleensä ainakin genealogisesti eli 
kielisukulaisuuden perusteella. Tällöin kielet jaetaan kielikuntiin jon- 
kin genealogisen luokittelun mukaisesti ja kielet valitaan otokseen 
esimerkiksi kielikunnan sisäisen rakenteen perusteella (ks. Rijkhoff & 
Bakker 1998) tai valitsemalla yksi kieli jokaisesta genuksesta. Genukset 
muodostavat maailmanlaajuisesti vertailukelpoiseksi tarkoitetun luokit- 
telun tason, joka vastaa karkeasti indoeurooppalaisen kielikunnan pää- 
haaroja, kuten germaanisia tai romaanisia kieliä (Dryer 1992). Toinen 
ositustaso on yleensä alueellinen. Tällöin kielet jaetaan samankokoisiin 
maantieteellisiin alueisiin, kuten Afrikka, Euraasia, Oseania, Australia, 
Pohjois-Amerikka ja Etelä-Amerikka, ja näiltä alueilta valitaan kieliä esi- 
merkiksi suhteessa kielten genealogiseen monimuotoisuuteen kullakin 
alueella (Miestamo 2005). 

Ositettu otanta on tyypillinen lähestymistapa otantaan kaikissa ih- 
mistieteissä, mutta sillä on myös ongelmansa. Typologiassa keskeinen 
ongelma liittyy genealogiseen ositukseen: ei ole itsestään selvää, mitä 
genealogista luokittelua tulisi käyttää, ja otannan tulos voi riippua käy- 
tetystä luokittelusta. Toinen ositetun otannan ongelma liittyy synkroni- 
seen ja dynaamiseen typologiaan, joita käsittelemme lyhyesti alla. 
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Otoksen muodostamisessa keskeinen kysymys on myös otoksen 
koko. Kun aineistoa analysoidaan sadoista kielistä, yhdestä kielestä ei 
voi analysoida kuin kapean alueen tai työmäärä kasvaa hallitsematto- 
maksi. Jos taas otoskoko liikkuu maksimissaan muutamassa kymme- 
nessä kielessä, tutkimuskohteen pystyy analysoimaan syvällisemmin. 
Kysymyksenasettelu ja otoskoko rajaavat näin ollen omalta osaltaan ty- 
pologista tutkimusta. Sopivan otoskoon löytäminen on tärkeää, koska 
liian pieni otos ei riitä luotettaviin yleistyksiin ja liian suuri otos taas 
hukkaa arvokasta tutkimusaikaa. Perkins (1989) esittää, että yleensä 100 
kieltä on riittävä otoskoko useimpiin typologisiin tutkimuksiin. Asia ei 
kuitenkaan ole niin yksinkertainen, sillä riittävä otoskoko riippuu ra- 
kennetyyppien määrästä typologiassa: mitä enemmän rakennetyyppejä 
kielenpiirteen typologisessa luokittelussa on, sitä enemmän aineistoa 
tarvitaan. Tyyppien määrää ei liioin välttämättä tiedetä edeltä käsin, jo- 
ten otoskoon minimi on parhaiten määriteltävissä silloin, kun tyyppien 
määrä tiedetään ennalta. 

Perkinsin ohje koskien otoskokoa liittyy myös keskusteluun kielen 
universaaleista ja niiden todentamisesta tilastollisin menetelmin. Typo- 
login tutkimusmateriaali tulee pääasiassa nykyään puhutuista kielistä, 
koska historiallisista kielimuodoista on säilynyt vain vähän dokumentteja 
ja ne muodostavat erittäin suppean otoksen historian saatossa puhutuis- 
ta kielistä. Tämä ei itsessään ole ongelma, mutta ongelmaksi voi tulla se, 
millaisia oletuksia käyttämäämme otantamenetelmään liittyy. Kuten yllä 
todettiin, typologiassa on tapana käyttää ositettua otantaa, jotta otoskielet 
olisivat toisistaan riippumattomia. Tällöin otokseen valitaan tyypillisesti 
vain yksi kieli kustakin kieliperheestä tai genuksesta. Mutta kun vali- 
taan yksi kieli kustakin kieliperheestä, otoksen perusteella ei voi päätellä, 
miten lähisukukielet muuttuvat kieliperheiden sisällä, vaan tuloksena 
on ainoastaan synkroninen tilannekuva siitä, miten tutkittu kielellinen 
rakenne on jakautunut maailman kielissä tiettynä aikana. Jotta tutkija 
voi perustellusti tulkita, että tällainen synkroninen jakauma heijastaa kie- 
lellistä universaalia, hänen on oletettava, että rakennetyyppien jakaumat 
ovat saavuttaneet ns. tasapainojakauman (engl. stationary distribution). 
Tasapainojakauma tarkoittaa sitä, että muutokset yhdestä tyypistä toi- 
seen tapahtuvat yhtä taajaan eri tyyppien kesken: koska kaikki muutokset 
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tyyppien välillä ovat yhtä yleisiä, synkroninen frekvenssijakauma ei enää 
muutu ajan myötä (Maslova 2000). Ongelmaksi muodostuu, ettei ole 
lainkaan selvää, miten tasapainojakauma voitaisiin todentaa. 

Ratkaisuksi on tarjottu lähestymistapaa, jota kutsutaan dynaamiseksi 
typologiaksi (esim. Greenberg 1978; Croft 2003; Bickel 2015). Sillä on 
juurensa jo 1970-luvun typologisessa ajattelussa, mutta sitä kyettiin so- 
veltamaan matemaattisesti ja tilastollisesti vasta 2000-luvulla (etenkin 
Maslova 2000). Dynaamisessa typologiassa luovutaan vaatimuksesta, 
että otoskielet olisivat toisistaan riippumattomia, eikä otantaa käytetä sii- 
hen, että suljettaisiin pois kielisukulaisuuden ja kielikontaktien sekoit- 
tava vaikutus. Tämä tarkoittaa sitä, että samasta kieliperheestä valitaan 
otokseen useita kieliä, jotta voidaan tutkia, millaisia diakronisia prefe- 
renssejä sukukielten kesken esiintyy. Kieliperheiden ja maantieteellisten 
alueiden vaikutusta voidaan sitten testata rakentamalla ne samaan tilas- 
tolliseen malliin testattavien lingvististen rakenteiden kanssa. Tällaiseen 
tilastolliseen tutkimukseen vaaditaan jo monimutkaisia monimuuttuja- 
menetelmiä, kuten logistista regressiota tai yleistä monitasomallia (engl. 
generalized multilevel modelling). On syytä pitää mielessä, että dynaami- 
sen lähestymistavan käyttö kasvattaa otoskokoa merkittävästi, koska 
kieliä valitaan sekä eri kieliperheistä että myös kieliperheiden sisältä. 
Tyypillinen otoskoko dynaamisessa typologiassa on noin 300-400 kiel- 
tä, usein enemmän (esim. Bickel 2015). 


3.3. Kielimateriaalin hankinta 


Kielimateriaalin hankintaan vaikuttavat oleellisesti tutkimuskysymys 
ja otoksen koko, ja tavallisesti materiaali hankitaankin samanaikaisesti 
otantaa tehdessä. Tyypillisin tutkimusmateriaali kielitypologiassa on yk- 
sittäisen kielen kielioppikuvaus tai tutkimuksen kohteena olevaa ilmiötä 
yksittäisessä kielessä käsittelevä tutkimus. Lisäksi sähköinen viestintä 
mahdollistaa vaivattoman yhteydenoton eri kielten asiantuntijoihin, jos 
omat lähteet eivät ole riittäviä. 

Tutkimusmateriaalin saatavuudessa on kuitenkin suurta hajon- 
taa. Suurista kielistä, kuten suomen kielestä, on olemassa useita 
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perusteellisia kuvauksia, kun taas pienistä ja uhanalaisista vähemmis- 
tökielistä ei välttämättä ole saatavilla muuta kuin yksittäisiä artikkeleita, 
jos niitäkään, ja ne riittävät vain harvoin lähteiksi omaan tutkimukseen. 
Eri kielikunnat ja maantieteelliset alueet poikkeavat toisistaan paljonkin 
siinä, miten syvällisesti ja laajasti niiden kieliä on tutkittu ja kuvattu. 
Etenkin Afrikassa ja Uudessa-Guineassa on paljon kieliä, joista ei ole 
vielä laadittu edes suppeaa kielioppikuvausta. 

Tämä vinouma lähdemateriaalin saatavuudessa vaikuttaa siihen, mitä 
kieliä eri kielikunnista ja eri maantieteellisiltä alueilta voi ylipäätään 
valita otokseen. Tämän vuoksi lähdemateriaalin saatavuus on otettava 
huomioon otannassa alusta pitäen. Usein typologi joutuukin palaamaan 
otantaan ja vaihtamaan joitakin otoskieliä sen takia, että alun perin otok- 
seen valittua kieltä ei kyetä analysoimaan, koska lähdemateriaali osoit- 
tautuu riittämättömäksi. Pahimmillaan lähteiden vaihteleva saatavuus 
voi johtaa siihen, että jotkin maantieteelliset alueet tulevat otoksessa 
aliedustetuiksi ja toiset taas vastaavasti yliedustetuiksi. 

Kokeneella typologilla on paljon hiljaista tietoa siitä, mistä kielistä on 
ylipäätään saatavilla tutkimusmateriaalia, ja viime vuosina on kehitetty 
myös erittäin hyviä työkaluja helpottamaan materiaalin keräämistä. Eri- 
tyisesti mainittakoon Glottolog (Hammarström, Forkel & Haspelmath 
2019), joka on paitsi katalogi maailman kaikista kielistä, niiden suku- 
laissuhteista ja maantieteellisestä sijainnista myös viitetietokanta, joka 
sisältää noin 330 000 viitettä etenkin vähemmän tutkittujen kielten tut- 
kimuskirjallisuuteen. Otantaa tehtäessä Glottolog on verraton työkalu, 
jonka avulla saa nopeasti käsityksen siitä, millaista tutkimuskirjallisuutta 
tietystä kielestä on saatavilla. Hyviä apuvälineitä otantaan ja tutkimus- 
materiaalin löytämiseksi ovat lisäksi The Ethnologue (Eberhard, Simons 
& Fennig 2019) ja WALS:n verkkoversio (Dryer & Haspelmath 2013). 
Varsinaista lähdemateriaalia on jo melko hyvin saatavilla avoimesti ver- 
kossa. Lisäksi Kansalliskirjaston finna.fi-palvelun kautta on saatavilla laa- 
dukkaita kuvauksia sadoista kielistä, mm. iso osa Mouton de Gruyterin 
julkaisemasta kirjasarjasta Mouton Grammar Library. 

Typologit tekevät usein itsekin kenttätyötä, mutta pääasiassa typo- 
logista tutkimusta tehdään kuitenkin toisten kielentutkijoiden laatimien 
tutkimusten perusteella. Tämä ei kuitenkaan tarkoita sitä, että tutkija 
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sellaisenaan kopioisi lahdemateriaalissa olevan analyysin omaan tut- 
kimukseensa. Typologi on toki paljolti riippuvainen lahdemateriaalin 
analyyseista, mutta kunnollinen lähdekritiikki on ensiarvoisen tärkeää, 
ja typologi muodostaa lähteiden pohjalta oman analyysinsa, mahdolli- 
suuksien mukaan useita eri lähteitä samasta kielestä vertaillen. Tark- 
kuus analyysissa on tärkeää paitsi tutkimuksessa tehtävien yleistysten 
ja johtopäätösten kannalta myös sen tutkimuseettisenkin kysymyksen 
kannalta, että yksittäiset väärin analysoidut esimerkit voivat jäädä elä- 
mään kielitieteellisessä kirjallisuudessa väärinä käsityksinä jostakin yk- 
sittäisestä kielestä (tutkimusetiikasta ks. Johdannon luku 4 tk.). Tutkijan 
on opittava arvioimaan lähteiden luotettavuutta, vertailtavuutta ja sitä, 


millaisesta teoreettisesta näkökulmasta kielen kuvaus on tehty. Lähtei- 
den vertailtavuuteen liittyy esimerkiksi kysymys kirjoitetun ja puhutun 
kielen suhteesta. Kieliopit pohjautuvat tyypillisesti puhuttuihin muotoi- 
hin, mutta etenkin Euroopan kielten ja ylipäätään suurten kielten kieli- 
oppien taustalla vaikuttaa kirjoitettu yleiskieli. Tällaiset erot aineiston 
luonteessa voivat mahdollisesti vaikuttaa otoksesta tehtäviin typologisiin 
yleistyksiin (Himmelmann 2000, 10-11). 

Lähteiden käytettävyyteen liittyy myös kysymys metakielestä, jolla ne 
on kirjoitettu. Kuten luvussa 2 todettiin, referenssikieliopit kirjoitetaan 
nykyisin yleisesti peruskielioppiteorian termein ja käsittein, jolloin ne 
ovat paljon laajemman tutkijajoukon käytettävissä kuin jonkin spesifin 
teorian formaalilla metakielellä kirjoitetut kieliopit. Tästä ääriesimerkki- 
nä voisi mainita 1960-1970-luvuilla tagmemiikan piirissä tuotetut kieli- 
opit, jotka ovat teoriaa tuntemattomalle tutkijalle erittäin vaikeaselkoisia 3 

Kielioppikuvaukset eivät suinkaan ole ainut mahdollinen lähde kiel- 
ten laajassa vertailussa. Esimerkiksi saman alkuperäistekstin kään- 
nöksiä eri kielille sisältävien rinnakkaiskorpusten käyttö on yleistynyt 
viime vuosina typologiassa. Tyypillisimpiä käytettyjä käännöksiä ovat 
raamatunkäännökset, elokuvatekstitykset ja EU-tekstit.^ Rinnakkaisteks- 
tit avaavat uudenlaisia mahdollisuuksia vertailuun, ne mahdollistavat 
mm. tekstifrekvenssien vertailun, mutta niillä on omat rajoituksensa 
siinä, minkä tyyppisiin tutkimuskysymyksiin niitä voidaan käyttää. Li- 
säksi on muistettava, että rinnakkaistekstit ovat käännöstekstejä ja voi- 
vat tekstilajina poiketa ei-käännetystä kielenkäytöstä (ks. Käännöstiede 
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ja sen menetelmät tk.). Kun rinnakkaiskorpuksen avulla vertailtavien 


kielten määrä kasvaa hyvin suureksi, jopa useisiin satoihin ja yli tuhan- 
teenkin kieleen (engl. massively parallel corpora), tarvitaan erityisiä meto- 
deja, joita on kehitetty näin laajaan korpuspohjaiseen vertailuun (esim. 
Cysouw & Wälchli 2008). 

Myös kyselylomakkeita käytetään typologiassa jonkin verran. Ne voi- 
vat olla hyödyllinen tapa kielimateriaalin hankintaan, etenkin jos tutkit- 
tavasta ilmiöstä on vaikea saada tietoa kielioppikuvausten tai tekstien 
avulla (ks. esim. Dahl 1985; Siewierska 1998; myös Kysely tk.) Kysely- 
lomakkeet mahdollistavat systemaattisen datan keräämisen ja soveltuvat 
hyvin laadittuina erilaisiin tutkimuskysymyksiin joko ensisijaiseksi tai 
täydentäväksi datankeruumenetelmäksi. Kyselylomakkeissa on kuiten- 
kin omat metodologiset ongelmansa: niillä kerätty data ei ole luonnol- 
lista kielenkäyttöä, varsinkaan jos kysely koostuu metakielestä käännet- 
tävistä lauseista; kuvista tai videoista koostuvissa kyselyissä ongelma 
on pienempi. Tällaisten elisitaatioon yleisesti liittyvien ongelmien li- 
säksi usein vielä lomakkeen täyttävä tutkija on ylimääräisenä välikätenä 
kyselylomakkeen laatineen tutkijan ja kielikonsultin välillä (ks. esim. 
Croft 2003, 29). Kyselylomakkeita, kuten mitä tahansa muutakin datan- 
keruumenetelmää, käytettäessä on pidettävä kirkkaana mielessä, mihin 
niillä kerätty data soveltuu ja mihin ei. 

Typologisen tutkimuksen lähteitä ja niiden asemaa kieliotoksessa aut- 
taa ymmärtämään dokulektin käsite. Dokulektillä viitataan jonkin konk- 
reettisen dokumentin esittämään kielimuotoon. Tällaisia dokumentteja 
ovat esimerkiksi referenssikieliopit, sanakirjat ja korpukset. Esimerkiksi 
Iso suomen kielioppi (Hakulinen, Vilkuna, Korhonen, Koivisto, Heino- 
nen & Alho 2004) edustaa yhtä dokulektiä ja Finnish: A Comprehensive 
Grammar (Karlsson 2018) toista. Typologin kieliotos koostuu siis itse 
asiassa dokulekteistä, ja kieltenväliset yleistykset tehdään dokulektien 
pohjalta. Typologin tutkimuskysymys ei koske ensisijaisesti tutkittavaa 
ilmiötä yksittäisessä kielessä vaan otokseen valikoituneiden dokulektien 
pohjalta piirtyvää kieltenvälistä yleistystä. Tällä seikalla voidaan ajatella 
olevan myös tutkimuseettisiä ulottuvuuksia: typologin tehtävänä ei ole 
reifioida (eli tehdä olevaksi) tai lokeroida kieliä, mitä on hyvä korostaa 
väärinymmärrysten välttämiseksi. 


LUKU 14 KIELITYPOLOGIAN MENETELMÄT 659 


Kielitypologiassa ei tyypillisesti olla suoraan tekemisiss4 kielenpuhu- 
jien kanssa, joten puhujien suostumukseen ja anonymiteettiin liittyvät 
tutkimuseettiset kysymykset koskevat typologiaa yleensä vain epäsuoras- 
ti. Toki toisten tutkijoiden keräämää aineistoa käytettäessä on kiinnitet- 
tävä huomiota aineiston käyttöehtoihin ja toimittava niiden mukaisesti. 
Kyselykaavakkeilla aineistoa kerättäessä nämä kysymykset ovat suorem- 
min osa tutkimusprosessia. 


3.4. Analyysi ja luokittelu 


Kun otos on laadittu ja otoskielistä on hankittu lähdemateriaali, seu- 
raava askel on kielimateriaalin analysointi ja tarkasteltavana olevassa 
kielenpiirteessä havaittavan kieltenvälisen variaation luokittelu eri (ra- 
kenne)tyyppeihin. Kielenpiirteellä tarkoitetaan tässä siis tarkasteltavana 
olevaa, tyypillisesti kielen rakenteeseen liittyvää ilmiötä, kuten sanan 
morfologista perusrakennetta, transitiivisen lauseen hallitsevaa sana- 
järjestystä tai vaikkapa negaation ilmaisua. Typologit pyrkivät sekä ku- 
vaamaan että selittämään kielenpiirteissä ilmenevää variaatiota, ja luo- 
kittelu on keskeinen vaihe tässä prosessissa. Esimerkiksi morfologisen 
perusrakenteen eri tyyppejä ovat luvussa 2 mainitut agglutinoivat, fusio- 
naaliset ja isoloivat rakenteet, kun taas transitiivisen lauseen hallitsevan 
sanajärjestyksen tavallisia tyyppejä ovat ne eri järjestykset, joihin lauseen 
osallistujat (subjekt ja objekti’) sekä verbi voidaan asettaa, kuten SVO, 
SOV tai VOS. Analyysi ja luokittelu kulkevat rinta rinnan, ja luokittelu 
tarkentuu sitä mukaa, kun uusia otoskieliä analysoidaan. Tällöin tyyp- 
pien määrittely voi päivittyä ja myös uusia tyyppejä voidaan tarvittaessa 
lisätä. 

Luokittelusta ei koskaan tule aukoton, sillä jokin uusi otoskieli voi 
poiketa muista niin paljon, ettei sitä voida luokitella samaan rakenne- 
tyyppiin muiden kielten kanssa. Tyypit ovat kieltenvälisiä yleistyksiä, 
joten jonkin ilmiön löytyminen yhdestä tai kahdesta kielestä ei vielä 
oikeuta omaa tyyppiään. Toisaalta voi olla, että jossakin menneisyydes- 
sä puhutussa tai tulevaisuudessa puhuttavassa kielessä on esiintynyt tai 
esiintyy rakenne, jota ei esiinny missään otoskielessä tai edes nykyään 
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puhuttavissa kielissä. Esimerkiksi 1970-luvulla kielitieteessä uskottiin, 
että lauseen pääasiallisessa sanajärjestyksessä objekti ei koskaan esiin- 
tyisi ennen subjektia ja verbiä (ns. OSV- ja OVS-sanajärjestykset). Tilan- 
ne kuitenkin muuttui, kun kenttätutkijat alkoivat julkaista enemmän 
kuvauksia Amazonin ja Uuden-Guinean kielistä. Etenkin Derbyshiren 
(1979; 1985) kuvaukset hixkaryanasta vakuuttivat epäilijät. Hixkaryana 
on yksi harvoista maailman kielistä, joiden perussanajärjestys on OVS 
(ks. esim. 2). Huomattakoon, että kun rakennetyyppi on yksi looginen 
mahdollisuus rajattujen mahdollisuuksien joukossa, kuten OVS sana- 
järjestysten joukossa, voidaan puhua tyypistä, vaikka se esiintyisi vain 
yhdessä kielessä. 


2) 
Toto y-ahosi-ye kamara. 
mies 3A.3P-tarttua-PST.CMPL jaguaari 


'Jaguaari nappasi miehen” (Derbyshire 1985, 32) 


Tämän esimerkin yhteydessä voimme myös todeta, että typologisessa 
tutkimuksessa käytetään nykyisin yleisesti ns. Leipzigin glossaussään- 
töjä (Leipzig Glossing Rules), joiden avulla voidaan tehdä erilaisten, 
lukijalle tuntemattomien kielten rakenteet näkyviksi ja ymmärrettävik- 
si. Esimerkkien valintaan liittyy myös tutkimuseettisiä kysymyksiä: on 
hyvä välttää mahdollisuuksien mukaan esimerkkejä, joiden sisältö saa- 
tetaan kokea loukkaavana. Lisäksi esimerkkien valinnalla voidaan myös 
vaikuttaa siihen, miten eksotisoivaa kuvaa eri kieliyhteisöistä pidetään 
yllä. Esimerkiksi Daniel Everettin väitteet koskien pirahä-kieltä ja sen 
puheyhteisön kulttuuria ovat saaneet osakseen kritiikkiä tästä näkö- 
kulmasta (ks. Everett 2004). 

Analyysivaiheessa huomio kiinnittyy etenkin kieltenvälisiin yhtäläi- 
syyksiin ja eroihin. Näiden perusteella kielimateriaalia jäsennellään 
ja aineistossa esiintyvistä rakenteista tehdään typologinen luokittelu. 
Analyysiprosessin yksityiskohdat riippuvat pitkälti siitä, miten syvälli- 
sesti kukin otoskieli analysoidaan. Mikäli kielellinen ilmiö on melko 
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suoraviivaista analysoida, riittää, että kirjaa itselleen luokittelun mää- 
ritelmät ja periaatteet, joita kielten analyysissa sovelletaan ja joita sen 
kuluessa mahdollisesti tarkennetaan. Tällöin voi otoskieliä analysoitaes- 
sa samanaikaisesti rakentaa tietokantaa (tietokannoista ks. Laadullinen 
aineistopohjainen kielentutkimus tk.), johon kunkin otoskielen ominai- 


suudet koodataan, eikä tekstimuotoon auki kirjoitettua analyysia tarvit- 
se välttämättä tuottaa kuin niistä tapauksista, joiden analyysi vaatii eri 
vaihtoehtojen punnitsemista. Esimerkiksi Sinnemäen (20143) noin 700 
kielen analyysi objektin differentiaalisesta sijanmerkinnästä noudatteli 
pääosin tätä analyysitapaa: objektin sijanmerkinnän tyypit analysoitiin 
ja kirjattiin tietokantaan lyhyin sanallisin kuvauksin, minkä pohjalta var- 
sinainen luokittelu sitten koodattiin tietokantaan ja perusteellisempi, 
auki kirjoitettu analyysi tehtiin vain niistä kielistä, joiden luokittelu oli 
vaativampaa. Toisaalta, jos luokiteltava kielellinen ilmiö vaatii syvälli- 
sempää analyysia, analyysin aukikirjoittaminen voi olla välttämätöntä 
jokaisen otoskielen kohdalla. Esimerkiksi Sinnemäen (2014b) analyysi 
sijanmerkinnän ja sanajärjestyksen kompleksisuudesta vaati perusteel- 
lisen 2—3 sivun tekstimuotoisen analyysin kustakin 50 otoskielestä. 
Tunnetuimpia typologisia luokitteluja ovat sanajärjestystypologia ja 
jo luvussa 2 mainittu klassinen morfologinen typologia. Siitä, millaisia 
luokitteluja typologiassa on esitetty näiden lisäksi, saa hyvän yleiskuvan 
WALS-tietokantaa selaamalla. Jokainen WALS:n karttaluku sisältää typo- 
logisen luokittelun, jonka eri tyyppien maantieteellisiä jakaumia sitten 
esitellään kartalla. On hyvä todeta, että kielten rakenteiden ja ominai- 
suuksien luokittelu ei ole koskaan itse tarkoitus vailla muuta päämää- 
rää, vaan se on yksi välttämätön vaihe tutkimusprosessissa. Luokittelun 
on oltava teoreettisesti perusteltu ja motivoitu. Typologinen tutkimus 
pyrkii paitsi kuvaamaan myös ymmärtämään kieltenvälistä variaatiota. 
Luokittelussa tulee siis pyrkiä kiinnittämään huomiota seikkoihin, jotka 
ovat relevantteja kieltenvälisten yhtäläisyyksien ja eroavaisuuksien selit- 
tämisessä. Esimerkiksi negaation ilmaisu voitaisiin jakaa tyyppeihin sen 
mukaan, miten monta vokaalia negaatiota ilmaisevassa morfeemissa 
esiintyy. Tällainen luokittelu ei kuitenkaan auttaisi ymmärtämään ne- 
gaatiota eikä tarjoaisi vastauksia mihinkään teoreettisesti kiinnostavaan 
negaatiota koskevaan tutkimuskysymykseen. Sen sijaan esimerkiksi 
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luokittelu tyyppeihin sen mukaan, miten kieltolauseet eroavat rakenteel- 
taan vastaavista myöntölauseista, voidaan yhdistää negaation funktio- 
naalisiin ominaisuuksiin, minkä avulla voidaan löytää motivaatioita eri 
rakennetyypeille (ks. Miestamo 2005). 


3.5. Rakennetyyppien jakaumien tarkastelu 


Luokittelu on ensimmäinen vaihe, kun kieltenvälisestä variaatiosta teh- 
dään yleistyksiä. Luokittelun pohjalta voidaan sitten siirtyä tarkastele- 
maan tutkittavan kielenpiirteen eri rakennetyyppien yleisyyttä, niiden 
genealogista (eli kielikuntakohtaista) ja maantieteellistä jakautumista 
sekä mahdollisia korrelaatioita muiden kielenpiirteiden kanssa. Yleensä 
tyyppien voidaan havaita esiintyvän epätasaisesti tarkasteltaessa maail- 
manlaajuisia frekvenssejä tai niiden maantieteellisiä jakaumia, ja typo- 
login tehtävänä on selvittää, mistä tämä johtuu. 

Kielenpiirteiden epätasainen jakauma voi johtua genealogisista tai 
maantieteellisistä syistä eli siitä, että jokin tyyppi on yleisempi kuin 
muut tietyssä kieliperheessä tai tietyllä maantieteellisellä alueella. Näis- 
sä tapauksissa voidaan sanoa, että frekvenssien epätasainen jakauma 
johtuu historiallisista tapahtumista yksittäisissä kieliperheissä, joissa 
tyypin yleisyys johtuu sen periytymisestä, tai yksittäisillä alueilla, joissa 
sama tyyppi on levinnyt kielestä toiseen kielikontaktin vaikutuksesta. 
Tutkimus on osoittanut, että suhteellisen harvan kielenpiirteen kohdalla 
eri tyypit ovat jakautuneet tasaisesti eri maanosissa, mikä kertoo kieli- 
kontaktien ja osittain myös kielisukulaisuuden vaikutuksesta tyyppien 
levinneisyydessä. 

Kielenpiirteiden levinneisyyttä tarkastellaan typologiassa yleensä myös 
käyttämällä karttoja, joiden avulla tyyppien maantieteellisiä jakaumia 
on mahdollista helposti hahmottaa. Yllä mainittu WALS-kartasto on 
hyvä esimerkki toisaalta siitä, miten typologit ovat alkaneet kiinnittää 
yhä enemmän huomiota maantieteellisiin jakaumiin, ja toisaalta siitä, 
miten tärkeä työkalu kartat ovat typologille. Siinä missä maailman poliit- 
tiset kartat piirretään yleensä Atlantti-keskisesti, typologiassa kartat piir- 
retään usein Tyynimeri-keskisesti. Tämän taustalla on ajatus siitä, että 
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joidenkin piirteiden maailmanlaajuiset jakaumat voivat heijastaa muinai- 
sia väestön liikkeitä ja jopa ihmislajin leviämistä Afrikasta muihin maan- 
osiin. On esimerkiksi todettu, että Tyynenmeren ympärillä puhuttavissa 
kielissä on samankaltaisuutta useissa kielenpiirteissä, joiden kohdalla 
muualla maailmassa esiintyy enemmän variaatiota (Nichols 1992); tästä 
esimerkkinä on numeraaliklassifikaattorien jakauma kuviossa 1. 


Numeraaliklassifikaattorien jakauma maailman kielissä 
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Kuvio 1. Kartta numeraaliklassifikaattorien (Gil 2013) esiintymisestä maailman 
kielissä (valkoinen = ei esiinny; musta = esiintyy).* 


Kielisukulaisuuden ja kielikontaktien lisäksi — ja myös niistä riippu- 
matta — on mahdollista, että rakennetyyppien maailmanlaajuiset frek- 
venssijakaumat viittaavat kielelliseen universaaliin. Universaalit ovat 
tavallisimmin tilastollisia preferenssejä, siis havaintoja siitä, että tietyn 
kielenpiirteen jokin rakennetyyppi on muita yleisempi. Esimerkik- 
si lauseen sanajärjestyksen suhteen subjekti yleensä edeltää objektia, 
mikä tarkoittaa sitä, että rakennetyyppi ”subjekti edeltää objektia” on 
yleisempi kuin tyyppi ”objekti edeltää subjektia” (esim. Bickel, Witzlack- 
Makarevich, Choudhary, Schlesewsky & Bornkessel-Schlesewsky 2015). 
Tämä on esimerkki tilastollisesta universaalista, mutta universaa- 
lit voivat olla myös absoluuttisia. Absoluuttiset universaalit koskevat 
kaikkia ihmiskieliä (esim. kaikilla kielillä on CV-tavuja). Teoreettisesti 
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kiinnostavia absoluuttisia universaaleja ei tutkimuksessa ole juurikaan 
löydetty, ja nekin, joiden on väitetty olevan absoluuttisia, ovat saaneet 
osakseen kovaa kritiikkiä (mm. Evans & Levinson 2009). Absoluuttisten 
universaalien löytäminen typologisin työkaluin voi olla jopa mahdotonta 
(Piantadosi & Gibson 2014). Funktionaalis-typologisessa tutkimuksessa 
tehdään tyypillisesti tilastollisia yleistyksiä kielistä ja oletetaan lingvis- 
tisten rakenteiden jakautuvan probabilistisesti eli esiintyvän eri toden- 
näköisyyksillä (ks. Bickel 2007). 

Typologisiin yleistyksiin liittyy myös yleinen harhakäsitys koskien 
vastaesimerkkejä. Toisinaan etenkin ei-typologit voivat ajatella niiden 
voivan kumota typologiset yleistykset. Yksittäiset vastaesimerkit ovat 
potentiaalisesti ratkaiseva ongelma kuitenkin vain absoluuttisille uni- 
versaaleille, sillä vastaesimerkit otetaan huomioon tilastollisessa tes- 
taamisessa. Vasta siinä tapauksessa, että uusia vastaesimerkkejä löytyy 
merkittävä määrä eri kielikunnista ja eri alueilta otoksen ulkopuolelta, 
voidaan tilastollinen typologinen yleistys kumota — aivan samoin peri- 
aattein kuin muissakin tieteissä. 


3.6. Typologiset korrelaatiot 


Korrelaatiot ovat kieltenvälisiä yleistyksiä kahden tai joskus useamman 
loogisesti toisistaan riippumattoman kielenpiirteen välisestä suhteesta. 
Riippumattomuus tarkoittaa tässä sitä, että kielenpiirteiden määritte- 
lyt eivät ole keskenään päällekkäisiä vaan määritelmien avulla rajataan 
tutkittavaksi eri kielenpiirteet, kuten vaikkapa sanojen keskinäinen jär- 
jestys ja sanojen taivutus. Myös korrelaatiot voivat päteä kaikkiin kieliin 
(= absoluuttiset universaalit) tai ne voivat päteä suureen osaan kieliä 
(= tilastolliset universaalit). Typologiset korrelaatiot on perinteisesti 
esitetty implikationaalisina universaaleina eli väitteinä, jotka kertovat 
kielenpiirteiden välisestä riippuvuussuhteesta implikaation muodossa 
p > g (luetaan ”jos p, niin g”) (Greenberg 1963; ks. myös Miestamo 
2010). Tunnetuimpia tällaisia implikationaalisia universaaleja ovat 
sanajärjestystä koskevat yleistykset, joissa eri lause- ja lauseketyyppien 
sanajärjestysominaisuudet ovat riippuvuussuhteessa keskenään. On 
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esimerkiksi havaittu, että jos kielen hallitseva sanajärjestys on VSO, sen 
adpositiot ovat yleensä prepositioita, ja jos taas kielen hallitseva sanajär- 
jestys on SOV, sen adpositiot ovat postpositioita (ks. Greenberg 1963; 
Dryer 1992). Tässä on itse asiassa kyse kahdesta erillisestä implikatio- 
naalisesta universaalista: 


3) VSO > prepositioita 
SOV > postpositioita 


Eri rakenteiden sanajärjestysominaisuuksien välillä on havaittu laa- 
jempia korrelaatioita niin, että voidaan puhua toisaalta VO- ja toisaalta 
OV-kielistä, joissa verbin ja objektin järjestyksen kanssa korreloivat mm. 
taulukossa 1 lueteltujen konstituenttien keskinäiset järjestykset. 


verbi, objekti VO OV 

adpositio, substantiivi AdpN (=prepositiot) NAdp (=postpositiot) 
omistettu (=N), omistaja (=G) NG GN 

substantiivi, relatiivilause NRel RelN 


Taulukko 1. Sanajarjestyskorrelaatioita. 


Kun implikationaalisissa universaaleissa yhdistyy vähintään kaksi toisis- 
taan loogisesti riippumatonta kielenpiirrettä, ne ovat askel partiaalises- 
ta, vain yhtä kielen ilmiötä koskevasta typologiasta kohti holistisempaa 
typologiaa. Voidaan ajatella, että partiaalisen ja holistisen typologian 
välillä on jatkumo: voimme yhdistää korrelaatioiden kautta kielen- 
piirteitä toisiinsa ja päästä lähemmäs kielen rakenteen kokonaiskuvaa. 
Kielitypologian yksi keskeinen tavoite onkin selvittää, millä tavoin ja 
missä määrin kielenpiirteet korreloivat keskenään. Kuitenkin sellainen 
typologinen parametri tai parametrien joukko, joka jotenkin kokonais- 
valtaisesti luonnehtisi kutakin yksittäistä kieltä, näyttää nykytietämyksen 
valossa utopistiselta tavoitteelta. Tällaisena voidaan pitää esimerkiksi 
1800-luvulla esiintynyttä ajatusta, että kielen morfologinen tyyppi ker- 
toisi kielestä jotakin yleisempää. 
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Implikationaaliset hierarkiat ovat useampien kielenpiirteiden välisiä 
riippuvuusketjuja, siis oikeastaan peräkkäin aseteltuja implikationaalisia 
universaaleja. Esimerkki implikationaalisesta hierarkiasta on lukuhierar- 
kia, jonka esitämme tässä yksinkertaistetussa muodossa: 


4) YKSIKKÖ < MONIKKO < DUAALI < TRIAALI 


Jos kielessä esiintyy jokin tällaisessa hierarkiassa mainittu ominaisuus, 
hierarkia kertoo, että silloin myös kaikki tästä vasemmalle olevat omi- 
naisuudet esiintyvät. Ominaisuuden esiintyminen siis implikoi kaikki 
siitä nuolen suuntaan olevat ominaisuudet. Lukuhierarkian tapauksessa, 
jos esimerkiksi todetaan, että kielessä on (kahta tarkoitetta ilmaiseva) 
duaalikategoria, voidaan hierarkian mukaisesti päätellä, että siinä on 
myös monikko ja yksikkö. Hierarkian mukaan duaalin läsnäolo kielessä 
ei kuitenkaan kerro mitään siitä, onko kielessä mahdollisesti (kolmea 
tarkoitetta ilmaiseva) triaali. 

Erityisen keskeiseksi kielissä vaikuttavaksi hierarkiaksi on osoittau- 
tunut elollisuushierarkia. On esitetty, että se säätelee erilaisia kieliopin 
ilmiöitä eri kielissä ja kiteyttää esimerkiksi objektin merkintää koskevan 
yleistyksen (Croft 2003; Sinnemäki 20142). Tämän yleistyksen mukaan 
jos hierarkiassa alempana esiintyvä referentti merkitään objektisijalla 
jossakin kielessä, myös kaikki hierarkiassa ylempänä esiintyvät referen- 
tit merkitään objektisijalla: 


5) IHMINEN < MUU ELOLLINEN < ELOTON 


Hierarkia kertoo myös sen, että elolliset objektit merkitään sijalla 
useammin kuin elottomat objektit. 

Vaikka implikationaaliset universaalit ovatkin olleet suosittu mene- 
telmä typologisten korrelaatioiden esittämiseen, niiden käytössä on 
tiettyjä ongelmia (Cysouw 2005). Yksi ongelma liittyy siihen, että jot- 
kin implikationaalisten universaalien kannalta kiinnostavat jakaumat 
eivät tilastotieteen näkökulmasta ole lainkaan kiinnostavia. Oletetaan 
esimerkiksi kaksi kuvitteellista sadan kielen jakaumaa (ks. taulukko 2), 
jotka esittävät piirteiden A ja B esiintymistä. Perinteisessä typologiassa 
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molemmat jakaumat ovat periaatteessa yhtä kiinnostavia, koska ne viit- 
taavat piirteiden A ja B väliseen korrelaatioon: kummassakaan otoksessa 
ei esiinny lainkaan rakennetyyppien A+ ja B- yhdistelmää. 


(a) A+ A- (b) A+ A- 
B+ 15 70 B+ 25 50 
B- o 15 B- o 25 
p=0.12 p = 0.0003 


Taulukko 2. Implikationaaliset universaalit ja tilastollinen testaaminen. (+ = piirre 
esiintyy kielessä; — = piirre ei esiinny kielessä; p = Fisherin tarkalla testillä saatu 
todennäköisyys jakaumasta.) 


Nämä jakaumat voitaisiin esittää kahden implikationaalisen universaa- 
lin avulla: A+ > B+ (eli jos kielessä esiintyy piirre A, siinä esiintyy myös 
piirre B) ja B- > A- (eli jos kielessä ei esiinny piirrettä B, siinä ei esiinny 
myöskään piirrettä A). Kuitenkin jos näitä jakaumia testataan tilastollisesti 
(tässä Fisherin tarkalla testillä), ainoastaan jakauma (b) poikkeaa odotetus- 
ta jakaumasta tilastollisesti merkitsevällä tavalla (p < 0.05, jota käytetään 
yleisesti kielentutkimuksessa tilastollisen merkittävyyden rajana), kun taas 
jakauma (a) ei (p > 0.05). Näin ollen vain jakauma (b) on tilastollisessa 
mielessä kiinnostava. Vaikka perinteisessä typologiassa on usein käytetty 
tilastollisia menetelmiä, implikationaalisia universaaleja ei ole aina to- 
dennettu tilastollisesti vaan ainoastaan frekvenssien perusteella. Tämä 
lienee yksi syy siihen, miksi modernissa typologiassa typologisia korre- 
laatioita ei esitetä enää kovin usein (pelkkien) implikationaalisten univer- 
saalien vaan edistyneempien tilastollisten menetelmien avulla. Erityises- 
ti monimuuttujamenetelmien, kuten erilaisten regressiomenetelmien, 
käyttö onkin lisääntynyt huomattavasti typologiassa (mm. Cysouw 2010; 
Sinnemäki 2011; Bickel 2015). Näiden menetelmien etuna on se, että kieli- 
sukulaisuuden ja kielikontaktien vaikutuksen suuruutta voidaan erikseen 
testata tilastollisesti. Esimerkiksi Sinnemäki (2011) osoitti, että kielen- 
piirteen jakaumaan voivat vaikuttaa niin muut kielenpiirteet kuin myös 
kielisukulaisuus ja kielikontaktit, mutta kuitenkin toisistaan riippumatta. 
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Viime vuosina typologit ovat kiinnostuneet myös kielenpiirteiden 
suhteesta kielenulkoisiin tekijöihin. Kielenpiirteiden jakaumia on tut- 
kittu esimerkiksi suhteessa puheyhteisön kokoon (Lupyan & Dale 2010; 
Sinnemäki & Di Garbo 2018), kielen puhuma-alueen ilmastoon (Everett, 
Blasi & Roberts 2015) ja geneettisiin tekijöihin (Dediu & Ladd 2007). 
Kielentutkimuksessa on perinteisesti ajateltu, että kielenpiirteet eivät 
vaihtele tällaisten tekijöiden suhteen, ja käytännössä 1900-luvun lop- 
puun asti tutkimuksessa vältettiin tällaisia tutkimusaiheita muutamia 
yksittäisiä poikkeuksia lukuun ottamatta. 2000-luvun alusta lähtien 
myös kielenulkoiset sosiaaliset, ekologiset ja biologiset tekijät ovat herät- 
täneet kiinnostusta ja keskustelua typologien kesken. Kun suuntaamme 
katseemme kielenpiirteiden ja kielenulkoisten tekijöiden suhteeseen, 
olemme tekemisissä kieltenvälisten yleistysten selittämisen kanssa. 
Seuraavassa luomme lyhyen katsauksen selittämiseen kielitypologiassa. 


3.7. Tulosten selittäminen 


Tutkimusprosessin viimeinen vaihe on tulosten selittäminen. Kuten yllä 
todettiin, typologista tutkimusta tehdään tavallisimmin funktionalisti- 
sessa viitekehyksessä. Selityksiä etsitään siis tyypillisesti kielenulkoisista 
tekijöistä, jotka vaikuttavat ilmiön syntyyn tai sen mukautumiseen ja 
sitä kautta kielten synkroniseen tilaan. Perinteiset funktionaaliset seli- 
tykset ammentavat semantiikasta, pragmatiikasta ja yleisistä kognitiivi- 
sista tekijöistä, kuten prosessointiin ja havaintoon liittyvistä seikoista. 
Viime aikoina on kiinnitetty myös enenevässä määrin huomiota kielen 
ekologiaan eli niihin lingvistisiin, sosiaalisiin, kulttuurisiin, historial- 
lisiin, maantieteellisiin ja fyysisiin ympäristöihin, joissa kutakin kieltä 
käytetään ja joiden kanssa kieli on vuorovaikutuksessa (esim. Haugen 
1972; Mählhäusler 1996). 

Yleisimpiä funktionaalisia selitysperusteita ovat ekonomia ja ikoni- 
suus (ks. erityisesti Croft 2003). Ekonomia tarkoittaa kielellisten raken- 
teiden ja prosessoinnin taloudellisuutta: suositaan sellaisia rakenteita, 
jotka päästävät puhujan mahdollisimman vähällä vaivalla. Ekonomia 
on ollut suosittu selitysperuste kielentutkimuksessa jo pitkään (esim. 
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Jespersen 1922, 261-264; Zipf 1949; Martinet 1955). Ikonisuus taas 
pyrkii mahdollisimman hyvään vastaavuuteen muodon ja merkityksen 
välillä ja toimii näin ekonomian kanssa kilpailevana motivaationa ja 
sen vastavoimana (esim. Haiman 1980). Esimerkki ekonomian ja iko- 
nisuuden välisestä kilpailusta on morfologisen typologian eri tyyppien 
välinen kamppailu: ikonisuus pyrkii luomaan ja säilyttämään agglutina- 
tiivista rakennetta, jossa jokaista merkitystä vastaa yksi muoto, kun taas 
ekonomisuus pyrkii rikkomaan tätä ideaalia mm. lyhentämällä muo- 
toja ja fuusioimalla ja assimiloimalla niitä toisiinsa. Ekonomia vaikut- 
taa etenkin kielen yleisimpien sanojen ja muotojen ominaisuuksiin, ja 
muotojen frekvenssiin nojaavat ekonomiapohjaiset selitykset ovat hyvä 
esimerkki käyttöpohjaisen lähestymistavan keskeisyydestä typologiassa 
(ks. Greenberg 1966; Haspelmath 2005; 2008). 

Myös kielen prosessoinnilla tai omaksumisella on pyritty selittämään 
useita typologisia yleistyksiä (ks. Sinnemäki 2014c). Etenkin edellisessä 
luvussa mainittuja sanajärjestyskorrelaatioita on selitetty kielen proses- 
soinnilla. Hyvin yleisellä tasolla nämä selitykset perustuvat siihen, että 
kun samanlaisessa syntaktisessa asemassa olevat elementit sijoittuvat 
johdonmukaisesti samaan järjestykseen kussakin kielessä, kielen syn- 
taktinen säännönmukaisuus lisääntyy ja kielen prosessointi helpottuu. 
Tunnetun tulkinnan näistä selitysperusteista on esittänyt Dryer (1992), 
ja vaihtoehtoisen prosessointimallin tarjoaa Hawkins (2004). 

Poikkeavat rakenteet selitetään tyypillisesti historiallisilla tekijöillä. 
Niiden esiintyminen voidaan selittää joko kielikontakteilla tai poikkea- 
valla innovaatiolla satunnaisissa kielikunnissa. Esimerkiksi SVO-kielet, 
joissa on postpositioita, esiintyvät tyypillisesti sellaisilla maantieteellisil- 
lä alueilla, joilla eri sanajärjestystyyppejä edustavat kielet kohtaavat. Suo- 
mi on tästä hyvä esimerkki: suomalais-ugrilaisilla kielillä transitiivisen 
päälauseen hallitseva sanajärjestys on tavallisimmin SOV ja adpositiot 
ovat postpositioita. Suomessa transitiivisen päälauseen hallitseva sana- 
järjestys on kuitenkin muuttunut SVO:ksi, koska suomi on ollut pitkään 
kontaktissa germaanisiin, balttilaisiin ja slaavilaisiin kieliin, joilla on 
SVO-sanajärjestys ja prepositioita. 
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4. Yhteenveto: typologia kielitieteen kentässä 


Kielitypologia on maailman kielten vertailevaa tutkimusta, mutta se ei 
toki ole ainut kielentutkimuksen ala, jossa tehdään kieltenvälistä vertai- 
lua tai jossa pyritään sanomaan jotakin yleistä ihmiskielestä. Yksi typo- 
logian lähialoista on luonnollisesti kontrastiivinen kielentutkimus, jossa 
myös verrataan kieliä toisiinsa ja pohditaan muun muassa, millä edel- 
lytyksillä kielten vertailu on mahdollista. Nämä alat kuitenkin eroavat 
toisistaan sekä tavoitteiltaan että menetelmiltään. Siinä missä kielitypo- 
logiassa tutkitaan systemaattisesti kieltenvälisiä eroja ja samankaltai- 
suuksia hyvinkin erilaisissa kielissä, kontrastiivisessa kielentutkimuk- 
sessa keskitytään tyypillisesti vertailemaan kahta kieltä, jotka ovat joko 
toisilleen sukua tai joita puhutaan maantieteellisesti samalla alueella. 
Kielitypologian perimmäinen tarkoitus on ymmärtää paremmin ihmis- 
kielen luonnetta, joten sen tavoitteet ovat teoreettiset ja liittyvät pitkälti 
perustutkimukseen. Kontrastiivisen kielentutkimuksen tavoitteet ovat 
selvemmin soveltavia, ja tällainen tutkimus palvelee usein esimerkiksi 
kielenopetuksen tarpeita. 

Kielitypologian lähialaksi voidaan katsoa myös (formalistinen) kieli- 
oppiteoria, sillä se on typologian tapaan kiinnostunut kielen univer- 
saaleista. Toisinaan onkin ajateltu, että kielitypologia ja chomskylai- 
nen universaalikielioppi muodostavat saman kolikon eri kääntöpuolet. 
Näiden alojen lähtökohdat ovat kuitenkin hyvin erilaiset, vaikka niiden 
kiinnostuksen kohteet osittain risteävätkin. Tässä artikkelissa olemme 
tarkastelleet etenkin funktionaalis-typologista lähestymistapaa kielen- 
tutkimukseen, ja tämän alan teoreettiset lähtökohdat ovat kielen käytös- 
sä ja kielen funktiossa maailman eri kielissä. Etenkin generatiivisessa 
kielitieteessä lähtökohta on kuitenkin kielen oletetussa biologisessa pe- 
rustassa ja universaalissa kielikyvyssä, ja sen parissa on ollut tapana tut- 
kia yhtä kieltä (usein englantia) syvällisesti toisin kuin kielitypologiassa, 
jossa on tapana tutkia kymmeniä tai jopa satoja kieliä samanaikaisesti. 
Bickel (2007) on jopa esittänyt, että funktionaalis-typologinen kielen- 
tutkimus on osa ihmiskulttuurin tutkimusta (laajasti ymmärrettynä), 
kun taas universaalikielioppi on osa kognitiotiedettä. Todettakoon 
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vielä, että kielen universaaleja ominaisuuksia tutkitaan myös monien 
kognitiivis-funktionalistisesti suuntautuneiden kielioppiteorioiden 
parissa (esim. langackerilainen kognitiivinen kielioppi ja goldbergi- 
läinen konstruktiokielioppi; ks. Kieliopin tutkimus ja kielioppiteoriat 
tk.), ja nämä lähestymistavat ovat teoreettisesti hyvinkin yhteensopivia 


typologis-funktionalistisen ajattelun kanssa. 

Kielitypologialle läheisimmät tutkimusalat löytyvät kuitenkin ns. 
diversiteettilingvistiikan piiristä. Tällä termillä on viime aikoina alettu 
kutsua toisiinsa läheisessä suhteessa olevia kielitieteen aloja, joiden 
yhteisenä tavoitteena on maailman kielellisen diversiteetin kartoitta- 
minen ja ymmärtäminen. Näitä aloja ovat kielitypologian lisäksi vä- 
hemmän tutkittujen kielten dokumentointi ja kuvaus, antropologinen 
lingvistiikka, historiallis-vertaileva kielentutkimus, areaalilingvistiikka 
ja kielikontaktien tutkimus (ks. ko. lukuja tk.). Erityisesti kielitypologia 
ja deskriptiivinen kielentutkimus ovat läheisessä suhteessa. Kuten jo 
johdannossamme totesimme, niiden välillä vallitsee riippuvuussuhde: 
siinä missä deskriptiivinen kielentutkimus tuottaa tietoa typologeille 
aiemmin heikosti tunnetuista kielistä ja niiden rakenteista, kielitypo- 
loginen tieto auttaa kenttälingvistiä suhteuttamaan käsillä olevan kielen 
rakenteen analyysin siihen, mitä maailman kielistä tiedetään, ja näin 
ymmärtämään tutkimansa kielen ilmiöitä paremmin. Näidenkin alojen 
lähtökohdat ja menetelmät eroavat kuitenkin toisistaan. Deskriptiivinen 
kielentutkimus pyrkii ymmärtämään ja kuvaamaan yksittäisen kielen 
kielioppia, ja tyypillisesti kunkin kielet kategoriat on kuvattava niiden 
omilla ehdoilla (ks. luku 2). Kielitypologiassa typologi pyrkii luomaan 
käsitteitä, joiden avulla kieltenvälinen vertailu olisi mahdollista huoli- 
matta yksittäisten kielten kategorioiden erilaisuudesta. Kielitypologi ei 
siis ensisijaisesti pyri sanomaan mitään jonkin yksittäisen kielen omi- 
naisuuksista, vaan hänen tutkimuskysymyksensä koskevat kieltenvälistä 
vaihtelua — kielten erilaisuutta ja samuutta ja niiden taustalla vaikuttavia 
tekijöitä. 

Tässä artikkelissa olemme esitelleet kielitypologiaa yhtenä lähestymis- 
tapana kielentutkimukseen. Esittelimme kielitypologian keskeisiä teo- 
reettisia taustoja, sen tutkimushistorian pääpiirteet sekä typologisen 
tutkimusprosessin eri vaiheet. Lisäksi olemme käsitelleet typologian 
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suhdetta muihin kielentutkimuksen lähialoihin. Kielitypologia kehittää 
menetelmiä maailmanlaajuiseen kieltenvälisen variaation tutkimuk- 
seen. Sen perimmäiset tavoitteet liittyvät ihmiskielen luonteen selvit- 
tämiseen, ja se on tärkeä lähestymistapa yleisen kielitieteen keskeisiin 
kysymyksiin. Typologinen tutkimus luo uutta tietoa kielten eroista ja 
samankaltaisuuksista ja niihin vaikuttavista tekijöistä, joten se tarjoaa 
tärkeää tietoa selvitettäessä, miten kieli varioi, miten se muuttuu ja mi- 
ten se on syntynyt. 
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VIITTEET 


1 Kiitämme artikkelimme toimittajia ja arvioijia hyödyllisistä kommenteista. Kaius Sin- 
nemäki on saanut rahoitusta artikkelin kirjoittamiseen Suomen Akatemialta (hanke 
nro 296212) sekä Euroopan tutkimusneuvostolta (ERC) Euroopan unionin Horisontti 
2020-tutkimus- ja innovaatio-ohjelmasta (sopimus nro 805371). 

2 "languages could differ from each other without limit and in unpredictable ways". 

3 Tagmeemin käsite syntyi strukturalismin parissa (Bloomfield 1933), mutta sen teki 
tunnetuksi Kenneth Pike (1912-2000), joka kehitti tagmeemianalyysista kattavamman 
kielen kuvauksen teorian (esim. Pike 1982). Lähestymistavan vaikeaselkoisuus johtuu 
osittain siitä, että siinä korostettiin kategorioiden kielikohtaisuutta siihen pisteeseen 
asti, että myös kategorioita kuvaaville termeille annettiin kielikohtaiset, esimerkiksi nu- 
meroista ja kirjaimista koostuvat nimet. Lisäksi kuvauksen taulukoiden ja formalismien 
tukena käytettiin usein vain hyvin niukalti suorasanaisia selityksiä. 

4 Katso lisää Jorg Tiedemannin ylläpitämästä OPUS-verkkosivustosta (http://opus.lingfil. 
uu.se/), joka listaa avoimesti saatavilla olevia rinnakkaiskorpuksia. 

5 —Glossaussäännöt löytyvät osoitteesta https://www.eva.mpg.de/lingua/resources/ 
glossing-rules.php. Esimerkissä käytetyt lyhenteet ovat: A = agentti, lauseen tekijä; 


P = patientti, teon kohde; cMPL = päättynyt aspekti; PST = menneen ajan tempus. 

6 Kuva on tehty R-ohjelmalla (R Core Team 2018) käyttämällä sen paketteja ggplot2 
(Wickham 2016), ggmap (Kahle & Wickham 2013) ja mapdata (Becker, Wilks & 
Brownrigg 2018). 
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Luku 15 Historiallinen ja vertaileva 
kielentutkimus 


Janne Saarikivi 


Mika? 


Historiallis-vertaileva kielentutkimus on kielitieteen vanhimpia ja laajim- 
min käytettyjä metodeja, ja sitä käytetään kaikkien kielikuntien tutkimuk- 
sessa. Sen avulla voidaan tutkia kielten välisiä historiallisia sukulaisuus- 
suhteita ja lainakontakteja sekä kielten äänne- ja muotojärjestelmän ja 
sanaston historiaa. Tämä luku käsittelee kielitieteen historiallisia meto- 
deja kiinnittäen päähuomion historiallis-vertailevaan eli komparatiivi- 
seen metodiin. Historiallis-vertaileva metodi hyödyntää nykykielten tai 
kirjallisesti säilyneiden kielimuotojen aineistoja ja selittää niissä havait- 
tavan variaation ja kielten väliset erot menneisyyden rekonstruoitujen 
vaihtelemattomien muotojen avulla. 


Katso myös: 


Luku 12 Kielikontaktien tutkimus 

Luku 14 Kielitypologian menetelmät 

Luku 16 Antropologinen lingvistiikka 

Luku 18 Näkökulmia filologiseen tutkimukseen 
Luku 19 Nimistöntutkimus 


Luku 21 Sosiolingvistiikka 
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1. Johdanto: kielihistorian tutkimuskohteet 


Kieli muuttuu ajan kuluessa. Historiallisen kielitieteen metodit mahdol- 
listavat kielen muutoksen ja historian tutkimuksen pitkien aikojenkin 
kuluttua. Samalla ne tuottavat aineistoa, jota voidaan hyödyntää ihmis- 
yhteisöjen alueiden, identiteettien, elinkeinojen sekä materiaalisen ja 
henkisen kulttuurin historian tutkimuksessa. 

Historiallisen kielitieteen ytimessä on varsinainen kielihistoria, joka 
on kielen äännerakenteen, sanaston, muotorakenteen ja syntaksin his- 
torian tutkimusta. Myös kielellisen variaation tutkimuksessa on yleensä 
mukana kielen historia. Murteet eli dialektit, eri alueiden kielimuodot 
ja sosiolektit eli eri sosiaaliluokkien kielimuodot ovat historiassa syn- 
tyneitä. Variaationtutkimus ei kuitenkaan ole varsinaista kielihistorian 
tutkimusta, ellei siihen sisälly historiallista kysymyksenasettelua 
(ks. Sosiolingvistiikka tässä kirjassa). 

Historiallisen kielitieteen metodit kohdistuvat sekä kielen sisäiseen 


että kielen ulkoiseen historiaan. Sisäisen kielihistorian tutkimuksella 
tarkoitetaan kielen sanaston ja kieliopin eli taivutusmuotojen ja ra- 
kenteiden muutoksen tutkimusta ja niiden varhaisempien muotojen 
rekonstruoimista. Ulkoista kielihistoriaa taas ovat kielten puhuma- 
alueiden, kieliä ylläpitävien sosiaalisten verkostojen ja uusia vaikutteita 
tuovien kulttuurikontaktien historia. Ulkoinen kielihistoria pyrkii usein 
monitieteiseen lähestymistapaan. Kielellisten materiaalien rinnalla kes- 
keisiä ovat tällöin mm. arkeologian, genetiikan, uskonto- ja kansatieteen 
aineistot. Silti myös ulkoinen kielihistoria pohjautuu aina sisäisen kieli- 
historian luomaan kuvaan kunkin kielen edeltäjistä, sukukielistä ja 
kontakteista. 

Historiallinen kielitiede käyttää monia eri tutkimusmenetelmiä. Filo- 
logiset metodit ovat vanhojen tekstien tutkimusta, erityisesti tekstien 
varhaisimman muodon rekonstruoimista eri käsikirjoitusvariantteja 
vertailemalla. Samassa yhteydessä tutkitaan sanojen ja käsitteiden mer- 
kityksenmuutosta, johto-opillista kehitystä ja muuta variaatiota sekä näi- 
den heijastamia kulttuurisia muutoksia. (ks. Näkökulmia filologiseen 
tutkimukseen tk.) 
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Historiallinen sosiolingvistiikka rekonstruoi menneisyyden kielen- 
käytön variaatiota, mm. yhteisöjen monikielisyyttä, kielellisiä verkostoja 
ja kontakteja sekä kieliyhteisöjen kulttuuria (ks. Sosiolingvistiikka tk.). 


Historiallisen nimistöntutkimuksen kohteena on paikan- ja henkilö- 
nimien alkuperä sekä yhteisöt, jotka ovat käyttäneet ja levittäneet nimiä. 
Nimistöntutkimuksen avulla on mahdollisuus selvittää eri alueiden ai- 
kaisempia kielioloja, esim. alueilla aiemmin puhuttuja kieliä, sekä var- 
haisia väestöliikkeitä ja kielenvaihtoja (ks. Nimistöntutkimus tk.). 
Kontaktilingvistiikka jäljittää kielten ja kieliyhteisöjen historiallisia 


kontakteja ja kielen muuttumista kontaktien myötä. Laajassa mieles- 
sä kontaktilingvistiikkaan kuuluu kaikki kontaktin aiheuttama kielen 
muutos ja sen erottaminen muista syistä aiheutuneista muutoksista. 
Suppeassa mielessä (laina)sanaston alkuperän ja siinä ilmenevien kon- 
taktien tutkimus on usein etymologian tutkimuskohde ja varsinainen 
kontaktilingvistiikka selvittää kielellisten rakenteiden muutosta esimer- 
kiksi morfosyntaksin ja äännejärjestelmän alalla (ks. Kielikontaktien 
tutkimus tk.). 

Tämä luku esittelee kuitenkin pääasiassa historiallis-vertailevaa meto- 
dia, joka on varsinaisen kielihistorian ydin. Historiallis-vertaileva metodi 


tuottaa päätuloksenaan kielisukulaisuuteen eli kielenaineksen periyty- 
vyyteen, muutokseen ja lainaamiseen liittyvää tietoa. Tästä johtuen se 
on avainasemassa myös tutkittaessa historiallisten kielikontaktien vai- 
kutuksia eli niitä asioita, jotka tavalla tai toisella ovat lainautuneet muis- 
ta kielistä; nimittäin jotta kielikontaktin vaikutukset voidaan tunnistaa, 
on tiedettävä, mikä kielessä on aikaisemmista kielivaiheista periytyvää. 
Historiallis-vertailevan metodin tutkimuskohteita ovat etymologia eli sa- 
naston historia, historiallinen fonologia eli äännehistoria, historiallinen 
morfologia eli muotohistoria sekä historiallinen syntaksi eli historialli- 
nen lauseoppi ja kielen rakenteiden muutoksen tutkimus. 
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2. Miksi kieli muuttuu? 
2.1. Äänteenmuutos 


Kielen muutokseen on monia syitä. Monet äänteenmuutokset liittyvät 
ääntämisen yksinkertaistumiseen. Ne voivat koskea sekä kielen foneet- 
tista järjestelmää eli ääntämistapoja että fonemaattista järjestelmää eli 
äännejärjestelmää. Historiallis-vertaileva metodi on kiinnostunut lähin- 
nä jälkimmäistä tyyppiä edustavista muutoksista. Tällaisia ovat esimer- 
kiksi äänteiden assimilaatiot naapuriäänteisin, äänteiden katoamiset ja 
uusien äänteiden syntymiset. Muutosten taustalla on usein pyrkimys 
puhua vähemmän ääntöenergiaa käyttäen. Käytännössä tällaiset ilmiöt 
kohdistuvat kielissä samantyyppisiin äännekonteksteihin, mikä mahdol- 
listaa niiden etsimisen historiassa. Esimerkiksi klusiilien muuttuminen 
affrikaatoiksi ja frikatiiveiksi etuvokaalin edellä (ki > Ci > si, ti > Ci > si, 
pi > pf > f) tai painottoman vokaalin katoamiset ovat muutoksia, joita 
tunnetaan lukuisista eri kielistä ja eri yhteyksistä. 


2.2. Analogia 


Äänteenmuutokset ovat yleensä säännöllisiä eli koskevat kaikkia saman- 
laisia äännesekvenssejä kielessä. Kielijärjestelmän tasolla ne kuitenkin 
aiheuttavat epäsäännöllisyyttä. Analogia on kielen epäsäännöllisyyk- 
sien mukauttamista tai korjaamista tavalla tai toisella säännönmukai- 
seksi. Toisin kuin äännemuutokset analogiset muutokset ovat yleensä 
epäsäännöllisiä, eli ne tapahtuvat vain yhden sanan tai muodon koh- 
dalla kerrallaan. Toisaalta kielijärjestelmän tasolla ne lisäävät kielen 
säännöllisyyttä. 

Esimerkiksi suomen sanasto kuuluu erilaisiin taivutustyyppeihin, 
joista osa on syntynyt säännöllisen äännekehityksen myötä, toiset taas 
siten, että taivutusmuotoa on yleistetty uusiin ympäristöihin, koska se 
on läpinäkyvä ja helposti segmentoitava. Turun murteelle tyypillinen 
si-imperfekti menis, tulis 'meni, tuli' on syntynyt yleistämällä ns. supistu- 
maverbien (ruveta : rupesi, karata : karkasi) imperfektin si-pääte muihin 
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taivutustyyppeihin. Virossa si-imperfektin voi muodostaa useimmista 
verbeistä. Se yksinkertaistaa huomattavasti monien eri verbityyppien 
taivutusta esim. suomeen verrattuna. 

Monesti analogia tasoittaa kielessä tapahtuneita äänteenmuutoksia. 
Esimerkiksi suomen sanan lahti aikaisempi asu on ollut laksi, joka on 
syntynyt vielä varhaisemmasta asusta “lakti. Tämä on osallistunut erilai- 
siin säännönmukaisiin äänteenmuutoksiin. Lopulta sanan nominatiivi- 
muoto laksi ei enää muistuttanut kovin paljon muiden sijojen muotoja 
(lahden, lahdessa jne.). Vaikka samanlainen paradigma on ollut myös 
esim. sanassa kaksi (kahden, kahdessa), on lahti-sanan kohdalla jostain 
syystä koettu tarpeelliseksi ottaa uusi analoginen nominatiivimuoto 
lahti käyttöön äänteellisesti säännönmukaisen laksi-muodon asemesta. 
Analogian mallina ovat toimineet muilla tavoin syntyneet äänteellisesti 
läheiset sanat, esim. riimisana lehti (vrt. Lehtinen 2007, 98-99). 


2.3. Sosiaalisesti ja kulttuurisesti muuttuva kieli 


Kaikki kielenmuutos ei johdu ääntämistapojen muutoksesta. Kielen- 
muutoksessa on kyse aina myös sosiaalisesta toiminnasta. Puhe ja 
kielenkäytön tyyli ovat tärkeitä asioita sekä yksilön persoonan että yh- 
teisön identiteetin luomisessa, ylläpitämisessä ja muutoksessa. Yleensä 
kaikki kielenkäyttäjät pyrkivät puhumaan hieman toisistaan poiketen 
mutta kopioivat silti toistensa antamia malleja. Näin kielenkäytön muo- 
dit muuttuvat vähän kerrallaan; yksi sana jää pois käytöstä ja toinen, 
muodikkaampi sana ottaa sen paikan. Esimerkiksi hullujenhuone on kor- 
vaantunut ensin sanalla mielisairaala, joka sittemmin on korvautunut 
ilmauksella psykiatrinen sairaala. Muutos kuvastaa yhteiskunnan arvo- 
jen ja psykiatrisiin sairauksiin liittyvien käsitysten muutosta. Tyypillistä 
on myös, että tietystä kontekstista tuttua idiomia tai rakennetta aletaan 
yleistää uusiin yhteyksiin. Aluksi sanotaan esimerkiksi, että ei ole kaikki 
kotona, ja pian tämän mallin mukaan, että ei ole kaikki kynät penaalissa 
tai ei ole kaikki muumit laaksossa (Kortelainen 2012). 

Kielijärjestelmän muutoksessa on perinteisesti katsottu olevan oleel- 
lista muutoksen sosiaalisen houkuttelevuuden eli prestiisin. Esimerkiksi 
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Suomen nykyisessä kielitilanteessa englanninkieliset ilmaukset leviävät 
erityisesti nuorisokielessä ja monenlaisissa ammattikielissä, koska ne 
liittyvät houkuttelevina pidettyihin sosiaalisiin roolimalleihin. 

Kielellinen kulttuuri, mm. käsitykset normeista sekä ei-toivottavista 
kielenkäytön tavoista, on omiaan vaikuttamaan käyttämäämme kieleen 
(Schiffman 1996; Toivanen & Saarikivi 2016). Tähän liittyvät myös ky- 
symykset enemmistö- ja vähemmistökielten välisistä suhteista ja siitä, 
missä sosiaalisissa verkostoissa ja tilanteissa vähemmistökielten käyt- 
täminen on kulloinkin mahdollista. Eri maiden ja alueiden kielelliset 
kulttuurit ovat tässä suhteessa hyvin erilaisia; yhdet ovat tolerantteja 
suhteessa monikielisyyteen ja murteelliseen puheeseen, toisissa vallit- 
see normitetun valtakielen suosiminen. 


2.4. Lainautuminen 


Kielenmuutos on usein sidoksissa kulttuuriympäristön muutokseen. 
Näin on erityisesti lainautumisen tapauksessa. Kulttuuriympäristön 
muuttuessa saadaan naapurikielistä uusia sanoja ja ilmauksia nimi- 
tyksiksi asioille, jotka ovat aikaisemmin olleet tuntemattomia. Itse asias- 
sa suomen johtamattomien ns. perussanojen valtaosa on lainasanoja. 
Lainautuminen voi kohdistua paitsi sanastoon myös kielen äänne- 
järjestelmään ja lauserakenteeseen. Tyypillistä on, että intensiivisen, 
yksilöiden kaksikielisyyttä sisältävän kielikontaktin tapauksessa kieles- 
tä toiseen kopioituu myös idiomeja ja rakenteita (engl. in the long run 
> pitkässä juoksussa) sekä ääntämistapoja ja äänteitä. Vastaavasti suo- 
men kirjakieleen kuuluvat äänteet b, d, g ja f esiintyivät alkuaan lähinnä 
lainasanastossa (banaani, dollari, fraasi), mutta niiden yleistyttyä ne ovat 
eräissä suomen varieteeteissa alkaneet esiintyä myös muussa sanastossa 
(esim. Stadin slangin galsa ’kylma’ < kalsa < ruotsi kall, dallaa < tallata). 
Vaikka intensiivinen sosiaalinen kontakti johtaa lainaamisen lisäänty- 
miseen, on toisaalta osoitettu, että kielenmuutosten kannalta oleellisia ovat 
usein pikemminkin heikot kuin vahvat sosiaaliset linkit (Milroy 1992). 
Vahvat linkit taas pitävät huolta kielijärjestelmän tietystä stabiilisuudesta 
ja riittävästä muuttumattomuudesta. Uusia kielenpiirteitä käyttäessään 
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ihmiset eivät kopioi niinkään oman perheensä tai lähiympäristönsä kieltä 
vaan toistavat muualta kuulemiaan sanoja ja rakenteita. 


2.5. Johtaminen 


Uusia sanoja nimityksiksi uusille asioille saadaan paitsi lainaamalla 
myös johtamalla ja yhdistämällä vanhaa sanastoa. Suomen kielessä 
yhdistämis- ja johtomahdollisuudet ovat hyvin monipuoliset. Monissa 
nykysuomen sanoissa on lukuisia peräkkäisiä sanoja ja johdinaineksia. 
Näin ovat viime vuosikymmeninä syntyneet mm. uudissanat elämys- 
puisto (viime kädessä sanoista elää ja puu), asiakaspalvelu (sanoista asia 
ja palvoa), sote-uudistus (sanoista sosiaalinen, terve ja uusi) ja lukematto- 
mat muut. Esimerkiksi tässä artikkelissa yli puolet sanoista lienee yhdis- 
telmiä ja johdoksia muista sanoista. Suuri osa tällaisesta sanastosta on 
melko uutta, vaikka sen rakenneosaset ovat usein ikivanhoja. 


2.6. Kielenvaihto 


Myös kielenvaihto on eräänlainen kielenmuutos, vaikkakin se johtaa 
kielen katoamiseen ainakin osassa sen puhujayhteisöä. Kielenvaihtojen 
mekanismit ovat yleensä kombinaatio pakkoa ja vapaaehtoisuutta. Taval- 
lisesti kyseessä on tilanne, jossa jokin kieli kadottaa sosiaalisen prestii- 
sinsä valtasuhteiden muutoksen tai yhteisön hajoamisen seurauksena. 

Kielenvaihdoista on tullut tavallisia modernissa maailmassa, jossa 
dominoivat puhutun kielen asemesta kirjakielet. Niihin liittyy kielellinen 
standardi, joka on opittava vuosia kestävässä koulutusprosessissa. Niitä 
käytetään myös työvälineenä moderneissa ammateissa, kuten opettajien, 
juristien, suunnittelijoiden ja konsulttien töissä, joissa vähemmistö- 
kielet ovat tarpeettomia. Modernia yhteiskuntaa luonnehtiikin, että yhä 
suurempi osa työelämästä on nimenomaan kirjoitetun kielen lukemista 
ja tuottamista. 

Kielenvaihtoja on silti ollut runsaasti myös esihistoriallisena aika- 
na. Monet esihistorian kieliyhteisöt ovat todennäköisesti suhtautuneet 
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kieliin melko pragmaattisesti kuten eräät metsästäjä-keräilijä-yhteisöt 
nykyäänkin. Niissä monikielisyys on ollut hyvin yleistä. Esimerkiksi 
Länsi-Siperiassa ihmiset ovat saattaneet osata kolmea neljää, jopa viittä 
kieltä alueesta riippuen, samoin historiallisella Inkerinmaalla. Vastaavaa 
monikielisyyttä on edelleen säilynyt mm. Afrikassa (Lüpke 2013). 

Monikielisissä yhteisöissä on helposti käynyt siten, että jokin tietty 
kieli on päässyt voitolle — yleensä koska kyseessä on ollut sosiaalisesti, 
kulttuurisesti tai taloudellisesti vahvimman ryhmän kieli — ja hävittä- 
nyt altaan kielellistä monimuotoisuutta. Esimerkiksi nykyisen Ranskan 
alueella puhutaan romaanista kieltä, mutta antiikin aikana alue oli kie- 
lellisesti kelttiläinen. Tiedetään, että kelttiläinenkään kielimuoto ei ole 
alueella alkuperäinen, vaan tätä ovat edeltäneet tuntemattomat paleo- 
eurooppalaiset kielimuodot. Niistä osa on mahdollisesti ollut sukua 
baskille, osa taas kokonaan tuntemattomia. Vastaavasti Anatolian eli 
nykyisen Turkin alueella, jossa turkki on nyt valtakieli, puhuttiin vie- 
lä keskiaikana kreikkaa, jota taas edelsi valtakielenä persian kieli, jota 
edelsi heetin kieli. Britannian alueella tiedetään englannin esimuotojen 
syrjäyttäneen mm. kelttiläisiä ja skandinaavisia kieliä, mutta nämäkään 
eivät edusta alueen varhaisimpia kieliä, jotka ovat todennäköisesti kuu- 
luneet kokonaan kadonneisiin kielikuntiin. Suomen alueella on esi- 
historian ja historian aikana tapahtunut ainakin kaksi lähes täydellistä 
kielenvaihtoa, ensin tuntemattomista muinaiskielistä saameen ja sitten 
saamesta suomeen, osin historiallisena aikana. Eräillä alueilla on suo- 
malaisväestö vaihtanut kielensä vielä ruotsiin, ja tätäkin myöhemmin on 
taas ruotsinkielinen väestö siirtynyt jälleen suomeen (Suomen osalta ks. 
Aikio 2012; Saarikivi 2006; ks. myös Sosiolingvistiikka tk). 

Jos jotain kieltä lakataan puhumasta kaikissa yhteisöissä, seuraukse- 


na on kielikuolema. Kielikuolemat ovat tällä hetkellä yleisiä. Arvioidaan, 
että jopa 50-90 % maailman kielistä voi kuolla muutaman sukupolven 
aikana. Historiallinen kielitiede voi jossain määrin tutkia sekä alueel- 
lisesti että kokonaan kuolleita kieliä, jos ne ovat jättäneet substraatti- 
vaikutuksia nykykieliin (ks. alla). 
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3. Historiallisen kielitieteen tutkimuskohteet 
3.1. Historiallis-vertailevan metodin tutkimuskohteet 


Sisäinen ja ulkoinen kielihistoria jakautuvat moniin tutkimussuuntiin. 
Perustan molemmille muodostaa historiallis-vertaileva eli historiallis- 
komparatiivinen metodi, joka on jatkuvasti täydellistynyt ja täsmentynyt 
(vrt. esim. Paul 1881; Ravila 1946; Anttila 1988; Fox 1995; Campbell 
1998. 

Historiallis-vertailevan metodin ytimessä ovat sanojen ja kielen 
affiksien (eli suffiksien, prefiksien ja muiden merkitystä kantavien 
sidonnaisten morfeemien) alkuperän ja äänneasun selvittäminen. 
Etymologia selvittää kielen sanaston ja kieliopillisten affiksien alku- 
perää sekä kielen sanastokerrostumia. Siihen on läheisessä yhteydessä 
myös historiallinen semantiikka eli merkitysmuutosten ja käsitteiden 
historian selvittäminen. Historiallinen fonologia taas selvittää kielen 
äännerakenteen historiaa ja siinä tapahtuneita muutoksia. Se on vuoro- 
vaikutussuhteessa etymologiaan, joka tuottaa sille aineistoa. Voi sanoa, 
että etymologia ja historiallinen fonologia edellyttävät toisiaan kuten 
kruuna ja klaava tai vasen ja oikea. 

Historiallis-vertailevan metodin hallitseva kielitieteilijä osaa arvioi- 
da sanojen ikää ja alkuperää niiden äänteistön ja merkityksen avulla, 
selittää sanoissa havaittavia äännevaihteluja historiallisesti ja kykenee 
näkemään, millaisista varhaisemmista muodoista sanat ovat saattaneet 
kehittyä. Tässä työssä apuna on tieto kielen fonotaksista eli kielen sa- 
nojen fonologisesti mahdollisista sanahahmoista. Esimerkiksi suomen 
kielessä ei alkuaan ole ollut sanoja, joissa on sananalkuisia konsonantti- 
yhtymiä. Niinpä sellaiset sanat kuin trooli, kranttu tai strategia ovat kaikki 
nuoria lainoja naapurikielistä. 

Historiallinen morfologia selvittää kielen taivutusmuotojen historiaa 
ja muutosta. Koska monet taivutusmuodot ovat alkuaan itsenäisiä sana- 
muotoja, ei etymologian ja historiallisen morfologian välinen raja ole 
kovinkaan selkeä. Kieliopillistuminen eli grammatikalisaatio on pro- 
sessi, jossa itsenäiset sanat ja niiden taivutusmuodot muuttuvat kieli- 
opillisiksi muodoiksi, mm. morfeemeiksi. Kieliopillistumista pidetään 
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lähinnä tutkimushistoriallisista syistä omana tutkimusalanaan, mutta se 
on kiinteästi sidoksissa historiallis-vertailevaan metodiin. 

Vaikka historiallis-vertailevan metodin aineistona on konkreetti- 
nen kielenaines, sanojen ja affiksien fonologinen hahmo, se selittää 
nykykielten vaihtelun menneisyyden abstraktioilla eli kantakielen re- 
konstruktioilla. Yleensä kantakielet ovat säännönmukaisempia kuin 
nykykielet ja niiden morfologinen variaatio on vähäisempää. Myös mui- 
naisissa kielimuodoissa on silti varmasti ollut variaatiota, mutta tämä 
variaatio ei välttämättä käy ilmi rekonstruktioista. 

Ajatus kantakielten eriytymisestä tytärkieliin saa mallinsa todelli- 
sista kielenmuutostapauksista. Esimerkiksi latina on muuttunut ny- 
kyisiksi romaanisiksi kieliksi, sanskrit nykyisiksi Etu-Intian kieliksi 
jne. Historiallis-vertaileva metodi pohjautuu oletukseen, että vastaava 
prosessi on tapahtunut useimpien muidenkin tai jopa kaikkien kielten 
historiassa. Tulee kuitenkin huomata, että nykyisten romaanisten kiel- 
ten pohjalta rekonstruoitu latina saattaisi monilta osin erota todellisuu- 
dessa olemassa olleesta latinan kielestä. 

Suurin osa maailman kantakielistä ei ole kirjallisesti säilynyt kuten 
latina, vaan ne tunnetaan ainoastaan rekonstruktioina. Kun historiallis- 
vertaileva menetelmä rakentaa nykykieliä vertailemalla kantakielten 
rekonstruktion, se luo samalla kantakielten taksonomian eli periy- 
tyvyysjärjestelmän. Esimerkiksi suomen kieli ja viron kieli yhdessä 
monien pienten itämerensuomalaisten kielten kanssa polveutuvat 
kantasuomesta, joka puolestaan polveutuu kantauralista. Kantauralista 
polveutuu kantasuomen lisäksi kuudesta kahdeksaan muuta kantakieltä, 
jotka ovat edelleen jakautuneet kymmeniksi nykykieliksi. Vastaavasti 
indoeurooppalaisen kantakielen tytärkieliä ovat latina, sanskrit sekä 
rekonstruoidut kantagermaani, kantaslaavi, kantakeltti ym. Nämä ja- 
kaantuvat sadoiksi nykykieliksi: kantagermaanista on tullut englantia, 
ruotsia, saksaa ym., kantaslaavista venäjää, puolaa, serbiä, jne. 

Yhdessä kaukaisimpaan yhteiseen rekonstruoitavaan kantakieleen 
palautuvat kielet muodostavat kielikunnan. Kielikuntia tunnetaan maail- 
massa n. 250. Historiallis-vertailevaa menetelmää voi soveltaa minkä 
hyvänsä kielikunnan tutkimukseen, mutta käytännössä monienkaan 
kielikuntien historiallis-vertaileva tutkimus ei ole kovin edistynyttä. 
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Esimerkiksi sellaisista maailmankielistä kuin nykykiinasta tai arabiasta 
ei ole ilmestynyt edes varsinaista etymologista sanakirjaa. Tämä johtuu 
monien kielten huonosta dokumentoinnista ja eri kielikuntien hyvin eri- 
asteisesta aikasyvyydestä. Historiallis-vertaileva metodi toimii parhaiten 
suhteellisen nuorten kielikuntien tutkimuksessa. 

Historiallis-vertaileva menetelmä näyttää luokitelleen maailman 
kielikunnat suhteellisen kattavasti. 1950-luvun jälkeen on löytynyt vain 
muutamia uusia kielikuntia, vaikka kielten dokumentaatio on jatkuvasti 
edennyt. Julkisuuteen silloin tällöin päätyvät sensaatiomaiset uutiset, joi- 
den mukaan suomen kieli on sukua esimerkiksi sumerille tai baskille, 
ovat yleensä historiallis-vertailevan standardimetodin kannalta perus- 
teettomia uutisankkoja. 

Nykyisin tiedetään myös, että maailmassa on myös eräitä aluei- 
ta, joilla ei ylipäätään esiinny suuria kielikuntia. Näitä ovat erityisesti 
metsästäjä-keräilijäväestöjen asuttamat alueet, kuten Papua tai Australia. 
Tällaisilla alueilla kielikunnat koostuvat tyypillisesti melko pienestä mää- 
rästä kieliä. Mahdollisesti syynä tähän ilmiöön on se, että metsästäjä- 
keräilijöiden pienet yhteisöt eivät enimmäkseen mahdollista huomatta- 
vaa väestönkasvua, mikä useissa tilanteissa on kielialueen laajenemisen 
edellytys. Mikäli näin on, suuret kielikunnat ovat ihmiskunnan histo- 
riassa suhteellisen nuori ilmiö ja liittyvät vasta maanviljelyksen syntyyn 
ja sen mahdollistamaan väestöjen moninkertaistumiseen. 


3.2. Historiallis-vertailevan metodin historiaa 


Ihmiset ovat aina olleet tietoisia lähisukuisten kielten välisistä saman- 
kaltaisuuksista. Kun Euroopan kielistä suuri osa polveutuu suoraan la- 
tinasta, jota käytettiin ainoana kirjakielenä satojen vuosien ajan, ajatus 
kielten polveutumisesta toisistaan on aina ollut luonteva. Kukaan ei liene 
koskaan tieteellisesti todistanut, että esimerkiksi ranska tai italia polveu- 
tuu latinasta. Asia on ollut itsestään selvä osa kieliyhteisön tietoisuutta. 
Myöskään suomen ja viron välistä sukulaissuhdetta ei ole koskaan todis- 
tettu missään toisin kuin esimerkiksi suomen ja saamen tai unkarin väli- 
nen sukulaisuus, joka voidaan havaita vain tieteellisten metodien avulla. 
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Historiallis-vertaileva metodi on alkuaan syntynyt renessanssiaikana 
harjoitettujen kielivertailujen pohjalle. Renessanssioppineet pyrkivat sel- 
vittämään maailman kaikkien kielten alkuperän ja suhteen Raamatun 
pyhiin kieliin, kreikkaan ja hepreaan. Samalla kerättiin aineistoja maail- 
man kielistä. Ensimmäisinä nykyisenkaltaisen historiallis-vertailevan 
metodin edustajina mainitaan usein unkarilainen jesuiittamunkki Jänos 
Sajnóvics (Sajnóvics 1964), joka todisti vuonna 1770 suomen, saamen 
ja unkarin välisen yhteyden, sekä brittiläinen sir William Jones, joka 
vuonna 1776 pitämässään esitelmässä todisti latinan, kreikan ja sans- 
kritin kielten yhteisen alkuperän. Molemmat näistä todistuksista sisälsi- 
vät sanaston ja kieliopillisten päätteiden vertailua sekä oletuksen, jonka 
mukaan samankaltaiset nykykielet ovat kehittyneet yhdestä ja samasta 
kadonneesta muinaiskielestä. 

1800-luvulla tämänkaltaiset melko epätäsmälliset ja jäsentymättömät 
vertailut kasvoivat systemaattiseksi tieteeksi. Historiallis-vertailevan me- 
todin varhaisina pioneereina mainitaan tanskalainen Rasmus Rask, sak- 
salainen Franz Bopp sekä myös kansansatujen kokoajana tunnettu Jacob 
Grimm, joka tunnetaan ns. Grimmin laista. Se selittää mm. latinan ja 
germaanisten kielten klusiilien ja frikatiivien välisen suhteen eli vaik- 
kapa sanaparien latinan pisces ~ englannin fish, latinan pos : podus ~ eng- 
lannin foot välisen suhteen olettamalla, että germaanisissa kielissä on 
tapahtunut klusiilien spirantistuminen (*p > f jne.) tietyissä asemissa. 
Samalla se selittää myös kantaindoeuroopan soinnillisten ja aspiroitu- 
neiden klusiilien muutokset ja nykyedustuksen germaanisissa kielissä. 

1800-luvun loppuun mennessä historiallis-vertaileva menetelmä kehit- 
tyi ns. nuorgrammatiikaksi, joka perustui ajatukseen kielenmuutoksen 
tietynlaisesta mekanistisuudesta. Nuorgrammatiikan ydinolettama oli, että 
kaikki kielenmuutos perustuu epäsäännöllisyyttä aiheuttaviin äänteen- 
muutoksiin tai säännöllisyyttä palauttavaan analogiaan. Samoin oletettiin, 
että kaikki äänteenmuutokset pohjautuvat lähtökohdiltaan poikkeuksetto- 
miin äännelakeihin. Tämän käsityksen kielihistoriasta esitti Hermann Paul 
vuonna 1881 ilmestyneessä teoksessaan Prinzipien der Sprachgeschichte 
(Kielihistorian perusteet), joka on edelleen arvostettu klassikkoteos. 

1800-luvun loppu ja 1900-luvun alkupuoli olivat historiallis- 
vertailevan kielitieteen kannalta ns. normaaliparadigman eli saman- 
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kaltaisia tutkimusasetelmia toistavan ja tietoa kartuttavan mutta meto- 
disesti konservatiivisen tutkimuksen aikaa. Useissa Euroopan maissa 
ilmestyi eri murteiden ja kielten äännehistorioita ja lainasanakerrostu- 
mia käsitteleviä tutkimuksia. Varhaisia kirjoitettuja lähteitä käsittävän 
indoeurooppalaisen kielikunnan tapauksessa fokus oli kantakielten re- 
konstruoinnissa. Uralilainen historiallis-vertaileva kielentutkimus taas 
kehittyi ennen kaikkea indoeurooppalaisista kielistä saatujen lainakerros- 
tumien tutkimuksena. Nykypäivänäkin on yhä tilanne, että indoeuroop- 
palainen kantakieli on paljon tarkemmin rekonstruoitu kuin uralilainen 
kantakieli. Vastaavasti uralilaisten kielten monet vanhatkin lainasana- 
kerrostumat on usein kohtalaisen hyvin kuvattu, kun taas kantakielen re- 
konstruktiot elävät koko ajan ja niihin liittyy paljon epävarmuustekijöitä. 

Jo varhain ymmärrettiin, että poikkeuksettomat äännelait ja ana- 
logia eivät voi selittää kaikkea kielen muutosta. Erityisesti murteiden 
tutkimus osoitti, että sanaston kehitykseen liittyy myös kontaminaatio 
ja kansanetymologia (ks. alla). Kun Hermann Paulin ja nuorgrammatii- 
kan aksiooma oli Die Lautgesetze kennen keine Ausnahme ("äännelait ovat 
poikkeuksettomia’), alettiin tämän rinnalla esittää murremaantieteen 
ja etymologian aksioomaa Chaque mot a son histoire ("jokaisella sanalla 
on itsenäinen historiansa’). Jälkimmäinen on pantu ranskalaisen kieli- 
historioitsija Antoine Meillet'n nimiin. 


4. Historiallis-vertailevan metodin 
soveltamisesta 


4.1. Peruskäsitteistä 


Keskeisiä historiallis-vertailevan metodin käsitteitä ovat äännevastaa- 
vuus, vastine, äännelaki, sisäinen ja ulkoinen rekonstruktio, periytyminen, 
lainautuminen ja substraatti. 

Kahden eri kielen historiallisesti toisiaan vastaavia äännekonteksteja 
kutsutaan äännevastaavuuksiksi ja toisiaan vastaavia sanoja vastineiksi 
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eli kognaateiksi. Esimerkiksi suomen sanan käsi vastineita ovat mm. vi- 
ron käsi, pohjoissaamen giehta, niittymarin kid, komin ki ja unkarin kéz. 
Saamen giehta-sanaa suomeen verrattaessa voidaan havaita äännevastaa- 
vuudet 1. tavun à ~ ie, 2. tavun i ~ a, sananalkuinen k ~ g ja niin edelleen. 
Säännölliset äännevastaavuudet voidaan yleensä selittää ns. äännelakien 
avulla. Äännelaki on samassa ympäristössä samalla tavoin tapahtunut 
äänteenmuutos. Esimerkiksi suomen sanan käsi ja saamen sanan giehta 
välisen äännevastaavuuden selittää muun muassa suomen kielessä ta- 
pahtunut ti > si -muutos. Kyseessä on kaikkia i:n etisiä t-äänteitä kos- 
kenut äännelaki, jonka mukaan ne ovat muuttuneet s-äänteiksi. Tämän 
lisäksi sanassa on tapahtunut mm. t-äänteen soinnillistuminen umpi- 
tavun etisessä asemessa, mikä on tuottanut ns. astevaihtelun eli d- ja 
t-äänteiden vaihtelun, joka näkyy muodoissa käden — kättä. Samanlainen 
vaihtelu on myös esim. sanoissa tosi, vesi, mesi jne. 

Äännelait voivat olla kontekstiehtoisia tai kaikissa konteksteissa 
tapahtuneita. Esim. ti > si -muutos on kontekstiehtoinen äännelaki, 
joka koskee t-äännettä i:n edellä. Muissa äänneympäristöissä t säilyy 
t-äänteenä jopa saman sanan taivutusparadigmassa (vrt. esimerkiksi 
käsi : kätenä). Vastaavasti toinen kantasuomessa tapahtunut äänteen- 
muutos, ns. $ > h -muutos on kaikkia konteksteja koskeva. Kaikissa kon- 
teksteissa tapahtuneet äännelait ovat huomattavasti harvinaisempia kuin 
kontekstiehtoiset. Kontekstiehtoisiin kehityksiin kuuluu esimerkiksi se, 
että painolliset ja painottomat tai sananalkuiset ja sanansisäiset ään- 
teet käyttäytyvät kielen historiassa eri tavoin. Tavallista on niin ikään, 
että äänteet assimiloituvat eli mukautuvat viereisiin äänteisiin tai että 
ensimmäisen tavun ja toisen tavun vokaali vaikuttavat toisiinsa kuten 
suomen kielen vokaalisoinnussa, jossa samassa sanassa ei voi esiintyä 
etu- ja takavokaaleja tietyin ehdoin. 

Käytännössä on havaittu, että äännelaillinen kehitys ohjaa kielen 
muutosta hyvin erilaisissa kielissä. Esimerkiksi Grimmin lakia (ks. 
edellä) vastaava suhde vallitsee myös suomen ja unkarin välillä. Suo- 
men pää-sanaa vastaa unkarissa fej, puu-sanaa fa ja poika-sanaa fiú. Myös 
saksan kirjakielessä (tai ns. yläsaksalaisissa murteissa) on tapahtunut 
sananalkuisen p:n affrikoituminen eli muuttuminen hälyäänteeksi etu- 
vokaalin edellä, mikä ilmenee verrattaessa ruotsin sanoja penning ja 
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peppar sekä saksan sanoja pfennig ja pfeffer. Maailman kielissä tapahtu- 
neet äänteenmuutokset toistavat siis yleensä samoja muutostyyppejä. 


4.2. Sisäinen rekonstruktio 


Päävälineinä historiallis-vertailevan metodin soveltamisessa ovat sisäi- 
nen rekonstruktio ja ulkoinen rekonstruktio. Seuraavassa tarkastellaan 
molempia hieman yksityiskohtaisemmin. 

Sisäinen rekonstruktio käyttää aineistonaan yhden kielen sisäisiä 
äännevaihteluita. Tätä voidaan havainnollistaa vertaamalla esimerkiksi 
eri taivutustyyppeihin kuuluvien suomen kielen nominien taivutusta: 


lasi: lasin: lasia kivi: kiven: kiveä = käsi: käden: kättä 


laki: lain: lakia laki: laen: lakea tosi: toden: totta 


Aineistosta voimme havaita, että suomen kielessä on kahdenlaisia 
sananloppuisia i-sekvenssejä. Toiset niistä ovat vaihtelemattomia, mut- 
ta toiset vaihtelevat sanansisäisessä asemassa esiintyvän e-sekvenssin 
kanssa. Tästä on päätelty, että 2. tavun vokaali on todennäköisesti ol- 
lut nykyistä väljempi myös sananloppuisessa asemassa ja että kivi- ja 
laki : laen -tyyppisten sanojen nominatiivi on ollut muotoa *kive, “lake 
(merkillä * eli asteriskilla kuvataan rekonstruoitua muotoa, jota ei ole 
elävässä kielessä tavattu). Tällöin koko sanan taivutusparadigma on 
ollut läpinäkyvän agglutinatiivinen eli koostunut helposti toisistaan 
erottuvasta sanavartalosta ja affikseista, joista kullakin on ollut oma 
merkityksensä. Sanan taivutus on perustunut yksinomaan sijasuffik- 
sin liittämiseen sanavartaloon (*kive : kive-n, “lake : lake-n). Voidaankin 
olettaa, että vokaali on supistunut jäätyään painottomaan tavunloppui- 
seen asemaan ja että näin on syntynyt nykyinen taivutus kivi : kiven. 
Tästä voidaan edelleen johtaa oletus, että vaihtelemattoman i:n sisältävät 
sanat ovat i-e-päätteisiä sanoja nuorempia, koska niissä esiintyy sup- 
peampi, alkuaan vain nominatiivimuodoissa syntynyt vokaali kaikissa 
taivutusmuodoissa. Taivutustyypin nuoruus voidaan havaita myös siitä, 
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että siihen kuuluvat sanat ovat usein uusia ruotsalaisperäisiä lainoja, 
vrt. lasi < glas, laki < lag jne. Nykyisin useimmat kieleen saatavat lainat 
omaksutaan tähän tyyppiin, vrt. traktori, professori, raportti, konteksti. 

Sanoissa tyyppiä käsi ja tosi esiintyy nominatiivimuodossa s-äänne, 
joka vaihtelee muiden taivutusmuotojen t- ja d-äänteiden kanssa. s-ään- 
ne esiintyy ainoastaan i-äänteen edellä, mikä antaa aiheen olettaa, että 
se on syntynyt t-äänteestä tässä asemassa. Kyseessä on siis ti > si -muu- 
toksen myötä syntynyt si-sekvenssi. Se, että asia todella on näin, voi- 
daan havaita vertaamalla suomen si-sekvenssin sisältämiä sanoja saman- 
merkityksisiin sukukielten sanoihin, vrt. siivota — pohjoissaame divvut 
"järjestää", sika ~ ersämordva tuvo. 

Sanoissa käsi ja tosi havaitaan edelleen myös t- ja d-äänteen vaihte- 
lua. Mikäli käytettävissämme olisi koko suomen murteiden aineisto, 
havaitsisimme, että suomen kirjakielen d-äänteen asemassa esiintyvät 
murteissa mm. äänteet r, | ja kato (käsi : kären, käsi : kälen, käsi : käen). 
Vanhastaan on samassa asemassa esiintynyt lähes kadonnut dentaali- 
spirantti ô, joka oli vielä Agricolan aikana käytössä myös kirjoitetussa 
kielessä. Vertaamalla näiden äänteiden esiintymistä t-àinteeseen voim- 
me havaita, että ne esiintyvät erilaisessa fonologisessa kontekstissa: t 
esiintyy tavuissa, jotka muodostuvat konsonantista ja sitä seuraavasta 
vokaalista (ns. avotavuissa), kun taas d ja muut sen asemassa esiintyvät 
äänteet esiintyvät konsonanttiin päättyvissä tavuissa (ns. umpitavuis- 
sa). Todellisuudessa esiintymistä säätelevät säännöt ovat vielä hieman 
monimutkaisempia. 

Kyseessä on suomen kielen astevaihteluna tunnettu avo- ja umpi- 
tavujen edellä esiintyvää konsonantismia koskeva vaihtelu. Se koskee 
suomen kielessä kaikkia klusiileja (k, t, p) sekä niiden muodostamia 
geminaattoja (kk, tt, pp) ja monia klusiileja sisältäviä äänneyhtymiä (rk, 
lk, nk jne.). Astevaihtelua esiintyy suomen kielessä sekä sanavartaloissa 
(takka : takan) että suffikseissa (kuusikko : kuusikon). 

Myös astevaihtelun tapauksessa voidaan turvallisesti olettaa, että 
umpitavun etinen ”heikko” ääntämys (d, r, | jne.) edustaa sekundaaria 
kehitystä, jonka taustalla on pyrkimys helpompaan ääntämiseen, ja että 
avotavun aloittava t on näissä sanoissa alkuperäinen. Tässäkin tapauk- 
sessa asia voidaan varmistaa tutustumalla suomen sanojen vastineisiin 
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sukukielissä: tosi — pohjoissaame duohta, käsi — pohjoissaame giehta, 


ersämordva ked’). 
Kun tunnemme äännevaihtelujen ehdot, voimme rekonstruoida suo- 
men kielen edeltäjään seuraavan vaihteluttoman järjestelmän: 


lasi: lasin: lasia kive: kiven: kiveä käte: käten: käteä 


laki: lakin: lakia lake: laken: lakea tote: toten: totea 


Tästä järjestelmästä voidaan selittää nykysuomen taivutus muutamilla 
säännöllisillä äännelaeilla, jotka ovat seuraavat: 


ett > ift (sanan lopussa) 
ti>si 


t, k, p > d, ø, v VC (klusiili heikkenee konsonanttiloppuisen tavun 
alussa). 


Edellä esitetty järjestelmä ei ole täysin sama kuin se, joka todellisuu- 
dessa rekonstruoidaan suomen kielen historialliseen edeltäjään kanta- 
suomeen. Siitä puuttuu eräitä morfologisia rajoituksia, kuten se, että 
possessiivisuffiksien kanssa suomen kielessä esiintyy ainoastaan ns. 
vahva aste (käteni, kätesi, kätemme, kätensä jne.). Kielessimme on myös 
ns. suffiksaalinen astevaihtelu eli 2. ja 3. tavun välissä havaittava aste- 
vaihtelu, joka liittyy mm. partitiivimuotoihin (vrt. lasia, lohta, jumalaa, 
kiveä, luuta). 

Todellisuudessa kantasuomen järjestelmä on ollut seuraavanlainen: 


kive: kiven: kivetä käte: käten: kätetä 


lake: laken: laketa tote: toten: toteta 


(sanat lasi ja laki ovat kantasuomen järjestelmää nuorempia). 
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Sisäistä rekonstruktiota voidaan käyttää suomen lisäksi minkä tahansa 
morfologialtaan rikkaan kielen tutkimiseen. Esimeriksi venäjän kielessä 
esiintyy äännevaihteluja saman sanan eri taivutusmuodoissa. Osaamis- 
ta ja voimista merkitsevän verbin infinitiivimuoto on moč, yksikön 1. 
persoonan muoto magu ja yksikön 2. persoonan muoto móžeš (venäjän 
ortografian mukaan Moub : MOTY : MOxKellb). Puhtaasti synkronisesti 
voidaan havaita, että vokaalivaihtelu liittyy sanapainoon siten, että sama 
äännesegmentti, joka esiintyy painollisena o:na, ääntyy painottomana 
a:na. Voidaan olettaa, että näissä tapauksissa painollinen äänne edustaa 
alkuperäistä kantaa. € ja Z taas esiintyvät lähinnä etuvokaalin edellä, kun 
taas g esiintyy takavokaalin edellä. Takavokaalin etiset ääntämykset ovat 
alkuperäisiä ja ääntöpaikasta selittyvä č ja 2 syntyneet sekundaaristi etu- 
vokaalin edellä. Voidaankin olettaa, että alkuaan kaikissa taivutusmuo- 
doissa on esiintynyt g-äänne, joka sitten on muuttunut Z- ja &äänteiksi 
erilaisin ehdoin. 

Sisäinen rekonstruktio mahdollistaa siis melko monipuolisen ku- 
van saamisen kielen äännehistoriasta, vaikka käytettävissä ei olisi kuin 
yhden kielen aineistoa. Usein sen avulla on mahdollista paitsi kuvata 
tapahtuneet äänteenmuutokset myös rekonstruoida niiden järjestys. Si- 
säistä rekonstruktiota on mahdollista soveltaa myös niihin kieliin, joilla 
ei ole lainkaan tunnettuja sukukieliä. 


4.3. Ulkoinen rekonstruktio 
Historiallis-vertaileva metodi ulottaa vertailunsa yksittäisten kielten 
muotoja laajemmalle eri kielten välille. Ulkoista rekonstruktiota voidaan 


havainnoida tutkimalla esimerkiksi seuraavia suomen ja viron välisiä 
muutoksia: 
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suomi viro suomi viro suomi viro 
kala kala kana kana sala- sala- 
muna muna sula sula vesa vösa 
orava orav jumala jumal pesä pesa 
veri veri käsi käsi tosi tösi 

musta must hirvi hirv perä pera 
ovi Ou pensas pöösas kansi kaas 


Voidaan havaita, että sanat vastaavat toisiaan eri tavoin riippuen niiden 
äännerakenteesta. Sanat, joissa 1. ja 2. tavun välillä on yksittäiskonso- 
nantti, ovat suomessa ja virossa lähes identtisiä. Niissä sanoissa taas, 
joissa 1. ja 2. tavun välillä on ollut konsonanttiyhtymä, vastaavat suomen 
kaksitavuisia sanoja viron kielessä yksitavuiset sanat. Aineiston pohjal- 
ta voimme päätellä, että viron kielessä on tapahtunut sananloppuinen 
muutos, vokaalin katoaminen, joka riippuu edeltävän konsonantismin 
luonteesta. Vastaava muutos on tapahtunut myös 3. tavussa yksittäis- 
konsonantinkin jäljessä. 

Aineistosta näkee myös monia muita muutoksia. Esimerkiksi suo- 
men 2. tavun ä-äännettä vastaa viron 2. tavun a-äänne. Mikäli taas suo- 
messa on ollut 1. tavussa e ja 2. tavussa a kuten sanoissa vesa ja pen- 
sas, on virossa syntynyt 1. tavuun äänne 6 (keskivokaali, joka äännetään 
samalla korkeudella kuin suomen takavokaali o mutta huulet leveinä 
kuten e:tä äännettäessä). 

Jos oletetaan, että suomen kanta on alkuperäinen ja viron uudempi, 
voidaan edellä olevan aineiston pohjalta kirjoittaa seuraavat virossa to- 
teutuneet äännelait: 


1) (C)VCCV# > (C) VCCO# (kaksitavuisissa sanoissa on 2. tavun vo- 
kaali kadonnut kaksoiskonsonantin jälkeisessä asemassa) 

2) (C) VC(C)ä > (C) VC(C)a (sananloppuinen -ä on muuttunut a:ksi) 

3) (C)eC(C)a > (C)6C(C)a (jos 1. tavussa on ollut e ja 2. tavussa a, on 
1. tavun e muuttunut ö-äänteeksi) 

(C = konsonantti, V = vokaali, # = sananloppu, Ø = kato) 
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Oletus, että viron sanoissa on tapahtunut muutoksia, kun taas suomen 
sanat edustavat alkuperäistä kantaa, perustuu myös muihin sukukieliin. 
Näistä useimmat ovat säilyttäneet vokaalisoinnun (perä-tyypin varta- 
lot) ja kaksitavuiset vartalot musta-tyypin sanoissa. Sen sijaan kysymys 
6-4anteen alkuperästä on mutkikkaampi. Aikaisemmin on oletettu mel- 
ko yksimielisesti, että suomen kieli edustaa tässäkin alkuperäistä kantaa, 
mutta mm. Petri Kallio (2012) on puolustanut käsitystä, jonka mukaan 
redusoitunut vokaali on kuulunut kantasuomen äännejärjestelmään ja 
kadonnut suomessa. Suomen vesa edustaisi siis uutta kehitystä ja viron 
vösa alkuperäista sanamuotoa. 


4.4. Äännekontekstien vastaavuus 
Todellisuudessa historiallis-vertailevaa metodia kuitenkin sovelletaan 


vertailemalla lukuisia kieliä yhtä aikaa, jolloin yhtäläisyydet alkavat näyt- 
tää ymmärrettävämmiltä. Aineisto voi näyttää esimerkiksi tältä: 


suomi p ä ä y d i n 

saame b a kn i a d a 

ersä p e u d' e m e 
mansi p ä nk v ä l ø m 
unkari f e j v e l ő 

komi p o m v e m 
suomi p i i k ä s i 

saame b a tn i g ie ht a 

ersä p e j k e d’ 

mari p ü J k i d 

komi p i n k i 

hanti p e nk k a t 

unkari f o g k € z 
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Esimerkin asettelusta näkyy, että historiallis-vertaileva metodi ei tark- 
kaan ottaen vertaile äänteitä eikä sanoja vaan sanoissa esiintyviä toisiaan 
vastaavia äännesekvenssejä (vrt. erit. Fox 1995). Monissa tapauksissa 
toisiaan saattavat vastata esimerkiksi kato ja yksittäisäänne tai useam- 
man äänteen kokonaisuus. Juuri monimutkaisten konteksti kontekstilta 
toistuvien äännevastaavuuksien tähden voimme olla varmoja siitä, että 
kielten historiallinen kehitys ei ole sattumanvaraista. 

Esimerkiksi suomen sanassa pii ja unkarin sanassa fog ”hammas?, tai 
suomen sanassa ydin ja unkarin samaa tarkoittavassa sanassa velö ei ole 
yhtään samaa äännettä. Kuitenkin kun vertaamme kaikkien sukukielten 
aineistoa, sanojen yhteenkuuluvuus alkaa näyttää ilmeiseltä. Uralilai- 
sissa kielissä on monia sanoja, joissa alkuaan hammasta tarkoittanut 
pii-sana on konsonanttipäätteinen tai kaksitavuinen. Tämä osoittaa, että 
suomen sanassa on tapahtunut keskikonsonantiston kato, joka on joh- 
tanut sanan muuttumiseen yksitavuiseksi. Historiallis-vertailevan meto- 
din avulla voidaan helposti todeta, että vastaava muutos on tapahtunut 
muissakin yksitavuisissa pitkän vokaalin sisältävissä sanoissa, siis myös 
esim. sanoissa luu, jää, pyy, sää ja niin edelleen. 

Äänteiden katoaminen selittää hyvin, miksi suomen ydin ja unkarin 
velö ovat sama sana. Vaikka sanat näyttävät näennäisesti aivan erilaisil- 
ta, ne noudattavat aivan samoja äännevastaavuuksia kuin monet muut 
suomen y-alkuiset sanat, n-päätteiset sanat tai sanat, joissa esiintyy d 
2. tavun alussa. Usein amatöörimäiset kielivertailut tunnistaakin siitä, 
että ne keskittyvät samannäköisiin sanoihin sen sijaan, että yritettäisiin 
osoittaa sanojen välillä vallitsevia systemaattisia äänteellisiä yhteyksiä. 
Esimerkiksi melko paljon julkisuutta saanut suomen ja sumerin sanas- 
ton vertailu (Parpola 2016) edustaa tällaista etäsukulaisuushypoteesia, 
joka ei toteuta normaalin kielisukulaisuuden perusvaatimusta eli ään- 
teellistä säännönmukaisuutta (Saarikivi 2016). 


4.5. Historiallis-vertaileva metodi ja kielten taksonomia 


Historiallis-vertailevaan menetelmään kuuluu oleellisesti kieli- 
kunnan taksonomia eli kysymys siitä, mikä kieli polveutuu mistäkin 
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rekonstruktiotasosta ja milla tavoin nykykielet suhteutuvat toisiinsa. Esi- 
merkiksi suomi ja viro palautuvat kantasuomeen, joka puolestaan palau- 
tuu kantauraliin. Vastaavasti venäjä ja puola palautuvat kantaslaaviin, 
joka palautuu indoeurooppalaiseen kantakieleen. Suomalais-ugrilainen 
kielikunta ja indoeurooppalainen kielikunta ovat molemmat kaksitasoi- 
sia siinä mielessä, että niissä on yhtäältä sekä nykyisten tai kirjallisesti 
tunnettujen kielten pohjalta rekonstruoituja kantakieliä (kuten kanta- 
suomi, kantasaame, kantagermaani, kantaslaavi jne.) ja toisaalta näitä 
kantakieliä vertailemalla luotu koko kielikunnan yhteinen kantakieli. 
Tällaista monitasoista rekonstruktioprosessia voidaan kuvata seuraavan- 
laisilla kaavioilla: 


savo turun 
murre 


vatja 5) liivi 
N m vóru 


—————» kantasuomi <— 


| 


viro 


kantaurali 
VS V kantapermi 
pohjoissaame = kantamordva komi | 
etelásaame udmurtti 
koltansaame T 
ersä 
moksha 


Kuvio 1. Kantauralin rekonstruktioprosessi (kuvion Copyright Nora Fabritius). 
Koko kielikunnan kantakielen rekonstruktio luodaan uudempien kantakielten 
rekonstruktioita vertailemalla. 
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venaja, puola, 


tsekki jne. 
saksa, englanti, 
ja Ji ; ruotsi jne. 
latvia, liettua jne. attaslavi x 
a kantabaltti g | kantagermaani iiri, kymri jne. 
albania aN ` { va kantakeltti < 
indoeurooppalainen kantakieli 
armenia — | | jä tokaari 
Sansa kreikka lata ~ oski, umbri jne. 
hindi, bengali, | ; S espanja, italia, 
urdu, jne. 5 nykykreikka ranska jne. 


Kuvio 2. Indoeurooppalaisen kantakielen kaksivaiheinen rekonstruktioprosessi 
(kuvion Copyright Nora Fabritius). 


Kantaurali (kuvio 1) tai indoeurooppalainen kantakieli (kuvio 2) ovat siis 
toisen asteen rekonstruktioita, jotka on luotu rekonstruktioita vertaile- 
malla. Kielikuntien sukupuut kuvaavat sitä, missä suhteessa eri-ikäiset 
kantakielet ovat toisiinsa ja minkä tason rekonstruktiot ovat kyseessä. 
Esimerkiksi suomalais-ugrilaisten kielten tapauksessa on keskusteltu 
ns. binaarisesti jakaantuvan ja pensasmaisen sukupuun eroista (ku- 
vio 3). Binaarinen sukupuu väittää, että suomen kielen edeltäjiä ovat 
kantasuomi, varhaiskantasuomi (itämerensuomalaisten kielten ja saa- 
men yhteinen kantakieli), suomalais-permiläinen kantakieli (itämeren- 
suomalaisten kielten, saamen, mordvan, marin ja permiläisten kielten 
kantakieli), suomalais-ugrilainen kantakieli (itämerensuomalaisten 
kielten, saamen, mordvan, marin ja permiläisten kielten kantakieli ja 
uerilainen kantakieli) ja kantaurali tässä järjestyksessä. Pensasmallinen 
sukupuu (kuvio 4) taas esittää, että suomen kielen kantamuoto kanta- 
suomi on vain yksi kantauralin lukuisista tytärkielistä. Useimmat tut- 
kijat ovat taipuvaisia ajattelemaan, että niin suomalais-ugrilaisten kuin 
indoeurooppalaisten kielten sukupuu muistuttaa pikemminkin pensasta 
kuin puuta, mutta monet yksityiskohdat ovat hämäriä (kuviot 5—7). 
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saame itämerensuomi Y Y Y 
unkari mansi hanti 
mari 


mordva | permi SS sane 


suomalais- 


saamelainen kk e kk. 


suomalais- 


permiläinen kk. ugrilainen kk. 


uralilainen kantakieli 


Kuvio 3. Binaarisesti haarautuva uralilaisten kielten sukupuu Kulosen (2002) 
mukaan (kuvion Copyright Nora Fabritius). 


itämerensuomi mari mordva  permi unkari mansi hanti 


saame 
uralilainen kantakieli 


Kuvio 4. Tapani Salmisen (1999) mukainen sukupensas (kuvion Copyright Nora 
Fabritius). Tällainen sukupuumalli olettaa kantakielen jakaantuneen useisiin 
kantakieliin jo varhaisvaiheessaan. 
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saame itamerensuomi mordva mari permi unkari mansi hanti samojedi 


P T1 LÀ 


lansiurali L keskiurali kantaobinugri 


länsi- ja keskiurali itäurali 
uralilainen kantakieli 


Kuvio 5. Häkkisen (2007) mukainen ehdotus sukupuuksi (kuvion Copyright Nora 
Fabritius). 


saame itämerensuomi Y . samojedi 
mansi Bana 
1 ] Ee MM E ta, 


Kantaurali 


Kuvio 6. Uusin uralilaisten kielten sukupuu (Saarikivi, painossa). Sulkeissa ku- 
hunkin kantakieleen palautuvan yhteissanaston määrä (kuvion Copyright Nora 
Fabritius). 
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5. Etymologia 
5.1. Sanojen alkuperän päätyypit 


Edellä on käsitelty äänteiden ja sanojen säännönmukaista kehitystä. 
Kielten sanasto voi olla paitsi kantakielestä perittyä myös johdettua, yh- 
distettyä tai toisista kielistä lainattua. Usein erotetaan vielä äänteellisesti 
motivoitu sanasto, ns. deskriptiiviset ja onomatopoieettiset sanat (vrt. 
esim. Häkkinen 1990) eli äänneasullaan asioita kuvaavat tai ääntä jäl- 
jittelevät sanat. 

Kun sanoja tutkitaan etymologisesti, käytetään peruskriteereinä 
yleensä sanan äänneasua, jonka tulisi systemaattisesti vastata joko suku- 
kielten tai lainantajakielen äänneasua, sanan merkitystä, jonka tulisi olla 
sama tai läheinen kuin sukukielten tai lainanantajakielen sanan (ks. tar- 
kemmin alla), ja sanan levikkiä, jonka tulisi viitata joko laina-alkuperään 
(mikäli sana esiintyy naapurikielissä) tai periytymiseen kantakielestä 
(mikäli sana esiintyy sukulaiskielissä) (ks. tarkemmin Häkkinen 1990). 


5.2. Perintösanasto 


Edellä esitetyissä esimerkeissä on ollut puhe pääasiassa kantakielestä 
periytyneestä sanastosta. Tällaisella sanastolla ei tavallisesti ole muuta 
tunnettua alkuperää. Perintösanastoon eli kielen kauimmin säilyvään 
sanastoon kuuluu tyypillisesti ruumiinosien nimityksiä (käsi, pää, veri, 
maksa), sääsanastoa (tuuli-, kylmä, lumi), luonnon perusilmiöiden ni- 
mityksiä (vesi, puu, maa, kivi) ja ihmisen perustoimintoja (mene-, näke-, 
kuule-, tule-) kuvaavia sanoja. Teknologioihin, raaka-aineisiin, uskontoon 
ja kulttuuriin tai paikallisesti rajattuihin ilmiöihin liittyvä sanasto taas 
on todennäköisemmin lainasanastoa (ks. luku 5.3.). 

Historiallis-vertailevaa metodia sovellettaessa oletetaan, että äänne- 
laillisesti toisiaan vastaavat sanat ovat olleet olemassa kantakielessä ja 
että niitä on käytetty jatkuvasti siten, että ne ovat muuttuneet nykykiel- 
ten sanoiksi. Historiallisessa dimensiossa esimerkiksi suomen ydin ja 
unkarin velö on siis yksi ja sama sana. 
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5.3. Lainasanat 


Yleensä kaikissa kielissä on ainakin jonkin verran toisista kielistä lainat- 
tua sanastoa, vaikkakin lainasanaston määrä vaihtelee hyvin paljon. Esi- 
merkiksi kiinan kielen sanastosta alle 1 % on voitu osoittaa lainasanoiksi 
(Haspelmath & Tadmor 2009), kun taas vaikkapa suomen tai englannin 
perussanoista valtaosa on eri-ikäisiä lainoja. 

Fri aikoina on suomen kielen edeltäjiin päätynyt mm. maanviljelyyn 
liittyvää sanastoa germaanisista kielistä (pelto < germaaninen “*feldo [vrt. 
englannin field], aura < germaaninen *arðra [vrt. ruotsin ärder 'aura']) ja 
metallien nimityksiä (rauta < germaaninen *rauda > ruotsin röd 'punai- 
nen’, alkuaan myös ’malmi’, hopea < *Sompeda < germaaninen *somptjo 
"pehmeä" > ruotsi, englanti soft) sekä kristinuskoon liittyvää sanastoa 
slaavilaisista kielistä (raamattu < kantaslaavin grämatä 'teksti; kirjoitus’ 
> nykyvenäjän gramota ’kunniakirja’, pappi < kantaslaavin papti > nyky- 
venäjän pop, risti < kantaslaavin kristii > nykyvenäjän krest). 

Lainasanoja otetaan usein sellaisiinkin merkityskenttiin, joissa on jo 
vanhaa sanastoa. Esimerkiksi suomessa on monia myöntämiseen käy- 
tettyjä sanoja (joo, jaa, kyllä), mutta tämä ei ole estänyt sellaisten laina- 
sanojen kuin okei ja jes leviämistä moderniin puhesuomeen. Vastaavan- 
laista muoti-ilmiöihin liittyvää lainaamista on selvästi ollut jo varhaisina 
aikoina. Esimerkiksi balttilaisista kielistä lainattiin suomeen mahdolli- 
sesti pronssikaudella sanat hammas ja kaula, jotka korvasivat sanat pii 
(esim. ilmauksissa haravan pii 'haravan hammas’ tai piikivi 'terávà ham- 
masreunainen kivi’) ja sepä (esim. johdoksessa sepalus). 

Kielestä toiseen lainattaessa lainansaajakielestä puuttuvat äänteet 
ja äänneyhtymät mukautetaan lainansaajakielen äännejärjestelmään 
ja fonotaksiin, eli ne käyttäytyvät lainansaajakielen äänteiden yhdistä- 
missääntöjen mukaisesti. Tällaista mukauttamista kutsutaan äänne- 
substituutioksi. Esimerkiksi ruotsin kielen sananalkuiset konsonantti- 
yhtymät on yleensä korvattu suomen kielessä yksittäiskonsonantilla, 
kuten tapauksissa laji < slag, talli < stall, lankku < planka, lantti < slant, 
raapia < skrapa, rahti < frakt, Ranska < fransk(a) ym. Vastaavasti esi- 
merkiksi unkarin kielessä on sananalkuiset konsonanttiyhtymät usein 
mukautettu kieleen lisäämällä uusi vokaali sanan alkuun: latinan schola 
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> iskola ’koulu’, italian stallo > istalló talli”, saksan Spital > ispotaly (vanh.) 
’sairaala’. 

Tutkimus on osoittanut, että samalla tavoin kuin kielen sisäiset 
äännekehitykset myös lainaaminen on säännönmukaista. Samassa lai- 
nautumistilanteessa on yleensä käytössä samantyyppiset lainasubsti- 
tuutiot kaikkien sanojen ja kaikkien samanlaisten äännekontekstien 
tapauksessa. Sama äänne voidaan silti substituoida hyvinkin eri tavoin 
riippuen siitä, esiintyykö se painollisena vai ei, minkä äänteen vieressä 
se esiintyy, tai siitä, onko kyseessä sanan loppu- tai alkuäänne jne. Pal- 
jon nykykielissä ilmenevästä lainasanaston äänteellisestä moninaisuu- 
desta johtuu myös siitä, että sanat on alkuaan lainattu eri murteisiin ja 
eri aikoina eri lähteistä. 

Esimerkiksi sananalkuinen si-yhtymä näyttää pitkään lainautu- 
neen suomen kielen edeltäjiin s-äänteenä. Tämä näkyy lainasuhteissa 
indoiraaninen *stambhas > sammas ’pylvas’, kantabaltti *staibis > seiväs, 
kantagermaani "stüra- > suuri (SSA [nide 3], 125, 139, 200; SKES: 962, 
992, 1136-1137). Jossain vaiheessa substituutiomalli tai -muoti on kui- 
tenkin muuttunut ja st-yhtymää on alettu korvata t-äänteellä (vrt. edel- 
lä). Sanan ikää voidaan näin ollen arvioida sen mukaan, millaisia laina- 
substituutioita siinä on käytetty. 

Sanan ikää voidaan arvioida myös sen perusteella, millainen on ol- 
lut lainasanan osoittama lainaoriginaali, ts. se lainanantajakielen sana- 
hahmo, josta nykykielen sana on saatu. Esimerkiksi germaanisten kiel- 
ten ”kuningasta' merkitsevät sanat ovat nykyisin ruotsin kung, saksan 
König, englannin king jne. Varhaisemmissa kirjoitetuissa kielimuodois- 
sa sana on kuulunut konungr (muinaisnorja), cuning (anglosaksi) ym. 
Kaikki nämä muodot voidaan johtaa kantagermaanin rekonstruoidusta 
muodosta *kuningaz, joka taas näyttää olevan suomen sanan kuningas 
alkumuoto. Äänteellisesti läheinen on myös liettuan pappia merkitsevä 
kunygas. Nämä kaksi sanaa on omaksuttu sellaisesta germaanin muo- 
dosta, joka on kirjallisesti säilyneitä kielimuotoja äänteellisesti vanha- 
kantaisempaa. Ne todistavat osaltaan sanan historiallis-vertailevaan me- 
todiin perustuvan rekonstruktion olevan uskottava. 

Äänteellisen mukautumisen lisäksi lainasanasto tulee mukauttaa 
lainansaajakieleen myös morfologisesti. Jos esimerkiksi lainansaaja- 
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kielessä on kieliopillisia sukutunnuksia, saavat myös lainasanat yleensä 
sellaiset. Vastaavasti suomen kieleen omaksutut sanat noudattavat jota- 
kin suomen kielen monista taivutustyypeistä. Melko usein lainasanat 
saavat samanlaisia suffiksaalisia päätteitä kuin vanha peritty sanasto. 

Suomen kielellä on lainasanatutkimuksen historiassa keskeinen roo- 
li, sillä se näyttää säilyttäneen monia indoeurooppalaisten kielten var- 
haisia sanahahmoja hyvin. Suomen kielen muutosnopeus näyttää olleen 
suhteellisen hidas, ja kieli on siinä mielessä äänteellisesti konservatiivis- 
ta. Ensimmäiset merkittävät lainasanatutkimukset germaanisten ja slaa- 
vilaisten kielten alalla, kuten Vilhelm Thomsenin (1870) ja Jooseppi J. 
Mikkolan (1894) tutkimukset, käsittelivät juuri lainakontakteja suomen 
kielen esimuotojen kanssa. 

1900-luvun jälkipuoliskolla erityisesti Jorma Koivulehto tutki suo- 
men kontakteja varhaisiin germaanisiin, balttilaisiin ja muihin indo- 
eurooppalaisiin kielimuotoihin. Hänen tutkimuksensa vaikuttivat monin 
tavoin kuvaan Euraasian kielellisestä esihistoriasta ja myös indoeuroop- 
palaisten kielten historiasta. Koivulehto on jopa ehdottanut, että suo- 
men kielessä olisi lainasanastoa, joka todistaisi kantaindoeuroopan ns. 
laryngaaliäänteistä eli kurkkuäänteistä, jotka sellaisenaan eivät ole säi- 
lyneet missään indoeurooppalaisessa kielessä heettiä lukuun ottamatta 
(Koivulehto 1991), mutta tätä hypoteesia ei ole yksimielisesti hyväksytty. 


5.4. Äänteellisesti motivoidut sanat 


Äänteellisesti motivoitunutta sanastoa lienee kaikissa kielissä. Se ei kui- 
tenkaan ole niissä samanlaista, sillä se ei jäljittele ääniä sellaisenaan 
vaan kunkin kielen fonemaattisiin konventioihin liittyen (Aikio 2001; 
Saarikivi 2006). Esimerkiksi suomen kielessä on olemassa konventio, 
jonka mukaan johtimellinen verbi, jossa on keskikonsonantistossa -r- tai 
-l-, voi olla ääntä jäljittelevä, kuten sanat surista, hurista, korista ja piristä. 
Tämän äänteellisen konvention mukaisesti on tarvittaessa mahdollista 
luoda uusia ääntä jäljitteleviä sanoja. Toisaalta esimerkiksi sellaiset sa- 
nat kuin varis, kaarne tai korppi vaikuttavat alkuaan ääntä jäljitteleviltä, 
mutta niiden taustalla oleva äänteellinen konventio näyttää kadonneen 
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kielestä. Nykykielen kannalta kyseessä ovat siis neutraalit sanat. Helposti 
ei huomaa sitäkään, että esimerkiksi sanat kapina, huhu ja juoru ovat 
aikoinaan olleet äänteellisesti motivoituja. 

Ääntä jäljittelevä sana voi edelleen muuttua deskriptiiviseksi. Tämä 
tarkoittaa, että sen ääntä jäljittelevä merkitys jää taka-alalle. Esimerkiksi 
sellainen sana kuin pimahtaa on alkuaan syntynyt ääntä jäljittelevästä 
tavusta pim. Nykykielessä se tarkoittaa kuitenkin lähinnä suuttumista tai 
järjen menettämistä. Kyseessä on alkuaan äänen metaforinen tulkinta: 
ihminen käyttäytyy ikään kuin hänen päässään kuuluisi "pim". 


5.5. Substraatti 


Substraattivaikutuksella tarkoitetaan kuolleiden tai alueellisesti väisty- 
neiden kielten vaikutusta nykykieliin, esim. saamelaista vaikutusta 
Peräpohjolan murteissa ja laajemminkin suomessa (Aikio 2008) tai itä- 
merensuomalaista vaikutusta pohjoisvenäläisissä murteissa (Saarikivi 
2006), sekä myös kielenvaihdon yhteydessä tapahtuvia puutteellisen 
kielenoppimisen vaikutuksia (ks. Kielikontaktien tutkimus tk.). Nämä 


sanan substraatti kaksi merkitystä ovat sillä tavoin erilaisia, että edelli- 
nen kuuluu varsinaiseen historiallis-vertailevaan kielentutkimukseen, 
jälkimmäinen kontaktilingvistiikkaan. 

Historiallisesti säilyvät substraattivaikutukset ovat tyypillisesti esim. 
paikannimistöä tai sanastoa (Saarikivi 2006). Usein myös kieliopissa ja 
kielen fonetiikassa on havaittavissa substraattivaikutuksia, joiden todis- 
taminen voi kuitenkin olla vaikeaa. Tämä johtuu siitä, että kielen muu- 
toksen mekanismeja on monia erilaisia ja ne ovat kontekstista toiseen 
vaihtelevia (ks. Kielikontaktien tutkimus tk.). 

Substraattisanasto on lainasanastoa siinä mielessä, että se on saatu 


toisista kielistä, mutta kahden erikielisen ryhmän kontaktien asemesta 
sanaston omaksumisprosessi on ollut pikemminkin kielenvaihto ja kieli- 
kuolema sekä tiettyjen sanojen säilyminen sen yhteydessä. Esimerkiksi 
saamelaiskielissä on runsaasti sanastoa, joka liittyy pohjoiseen luontoon 
ja elinkeinoihin mutta joka ei periydy varhaisemmista kantakielistä tai 
ole tunnettua lainaa naapurikielistäkään, esim. pohjoissaamen njálla 
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'naali', morsa 'mursu', gáisa 'lumihuippuinen vuori, jässa ”lumipälvi vuo- 
ren rinteella’ jne. Tällöin on ilmeinen johtopäätös, että sanasto on saatu 
alueella aiemmin puhutuista kielistä substraattivaikutuksina. 


5.6. Kontaminaatio ja kansanetymologia 


Sanaston historiaan liittyy usein monenkertaisia johtoprosesseja sekä 
sanojen sekoittumisia eli kontaminaatioita. Esimerkiksi sana kolaho- 
listi on kontaminaatio, joka on muodostettu sanojen alkoholisti ja kola 
pohjalta. Usein kontaminaatioita aiheuttaa kansanetymologia eli äänne- 
asultaan läheisten sanojen samaistaminen toisiinsa. Kansanetymologia 
on analogian erityinen muoto, jota havainnollistaa Helsingin Huopa- 
lahden kaupunginosan nimi. Alun perin alueen nimi on ollut Haapa- 
laksi, joka on lainautunut ruotsiin asussa Hapalax. Tämä on ruotsin 
kielessä tapahtuneiden muutosten ansiosta muuttunut nykyasuunsa 
Hoplaks, joka sitten on jälleen lainattu suomeen muodossa Huopalahti. 
Nimellä ei ole mitään tekemistä huovan kanssa, eikä sen toinen kompo- 
nentti ole alkuaan lahti vaan laksi, mutta nimi on kansanetymologisesti 
samaistettu fonemaattisesti läheisiin sanoihin. 


6. Muotohistoriaa 


Periaatteessa aivan samalla tavoin kuin äänteistön ja sanaston histo- 
riaa tutkitaan historiallis-vertailevan menetelmän avulla myös kielen 
taivutusmuotojen eli morfologian historiaa. Esimerkiksi jo edellä on 
viitattu astevaihteluun eli suomen kielen klusiilien heikkenemiseen his- 
toriallisen umpitavun edellä. Vaikka tämä muutos on lähtökohdiltaan 
fonemaattinen ja koskee siis tiettyjen äänteiden muuttumista tietyssä 
ympäristössä, on se käytännössä muuttanut suomen kielen taivutus- 
järjestelmää siten, että vaikkapa äänteellisesti läheisten sanojen pata ja 
data genetiivimuodot muodostetaan nyt eri tavoin. 
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Edellä on mainittu kieliopillistumisesta eli grammatikalisaatiosta. 
Kielen historiassa toistuu tilanne, jossa itsenäiset sanat muodostuvat 
kieliopillisiksi affikseiksi, tai tilanne, jossa affiksin merkitys muuttuu. 
Esimerkiksi suomen kielen sanamuodosta kansassa on syntynyt post- 
positio kanssa (Juhan ja Joukon kanssa, alkuaan kansassa eli 'Juhan ja 
Joukon seurassa’). Tämä on edelleen kehittynyt viron kielessä ja monissa 
suomen puhekielen muodoissa sijamuodoksi, jota voi kutsua komitatii- 
viksi tai eräissä tapauksissa instrumentaaliksi (vrt. viron söita autoga 'ajaa 
autolla”, kirjaimellisesti soittaa auton kanssa”, tai suomen juon kahvia 
maidonkaa, jossa -kaa muistuttaa postposition asemesta sijamuotoa [Si- 
rola-Belliard 2016]). 

Sanan ja kieliopillista merkitystä kantavan affiksin välinen raja on liu- 
kuva. Yleensä affiksiksi muuttunut sana on fonemaattisesti muuttunut 
siinä määrin, että sitä ei enää tajuta sanamuodoksi. Tyypillistä on esim. 
sanapainon menetys ja monenlainen redusoituminen. Yleisesti on tapa- 
na ajatella, että säännölliset äänteenmuutokset eivät koske sellaisia sano- 
ja, jotka ovat kieliopillistuneet eli grammatikalisoituneet, ts. muuttuneet 
itsenäisistä sanoista affikseiksi. Kielessä on edelleen sana kansa, joka on 
äänteellisesti säännöllinen suhteessa sukukielten ja lainanantajakielen 
sanoihin, mutta tämä säännönmukaisuus ei koske sanan kansa taivutus- 
muodosta kansassa muodostunutta postpositiota tai sijamuotoa -ga. Toi- 
saalta vastaavaa redusoitumista näyttää tapahtuvan ainakin jonkin ver- 
ran myös yhdyssanoille ja johdoksille niiden merkityksen muuttuessa. 
Esimerkiksi suomen taas on alkuaan sama sanamuoto kuin takaisin, ja 
suomen tänään on alkuaan sanaliitto tänä päivänä. 

Kieliopillisten taivutusmuotojen kehityksen edellytys on sanojen ja 
affiksien merkityksen muutos ns. reanalyysin kautta. Yleensä sanan 
ja suffiksin raja ymmärretään uudelleen siten, että osa vanhasta sana- 
vartalosta siirtyy suffiksiin. Esimerkiksi savolaismurteissa tavattava 
loi-monikko (kukkoloita, taloloita) on syntynyt ilmeisesti sanoista, joissa 
-I- on alun perin kuulunut sanavartaloon (vrt. pappila : pappiloita, satula 
: satuloita). l-aines on kuitenkin tajuttu päätteen osaksi, ja sitä on alettu 
yleistää kaikenlaisiin konteksteihin samaan tapaan kuin imperfektin 
si-tunnusta, josta on puhuttu edellä. Vastaavalla tavalla ovat syntyneet 
myös viron illatiivimuodot koolisse 'kouluun', linnasse ”kaupunkiin, 
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autosse ’autoon’. Niihin on yleistetty se-aineksinen illatiivin pääte niistä 
sanamuodoista, joissa se on säännöllinen, vrt. su harmaa : harmaaseen, 
varis : varikseen, viro vares : varesse. 


7. Syntaksin historiaa 


Historiallis-vertailevan metodin ytimessä on kielen fonologinen muoto, 
sanat ja affiksit. Sen sijaan se on jossain määrin heikompi kielellisten ra- 
kenteiden, kuten syntaksin, historian tutkimuksessa. Metodin tutkimus- 
kohdetta voisi verrata esimerkiksi arkeologin esiin kaivamaan kadon- 
neeseen taloon, jossa on historiallisten esineiden jäänteitä. Arkeologi 
voi tutkia esineiden tyyppejä ja muotoja. Hän voi myös pohtia, missä 
järjestyksessä esineet alkuaan olivat esiin kaivetussa huoneessa, mutta 
tämä on aivan erilainen tutkimustehtävä. Kielihistorian ytimessä taas 
ovat esinetyyppeihin verrattavat tutkimuskohteet: yksittäiset sanat, ään- 
teet tai kielen muodot. 

Edellä on kuitenkin jo viitattu siihen, että kielen muutokseen histo- 
riassa kuuluu myös sanojen ja affiksien funktion muuttuminen. Tämä 
mahdollistaa syntaksin historian tutkimuksen. Esimerkiksi suomen kie- 
lessä on demonstratiivipronominista se tullut eräänlainen määräinen 
artikkeli. Vastaava kehitys on tapahtunut myös unkarin kielessä, jossa 
lisäksi lukusana egy ’yksi’ on kehittynyt epämääräiseksi artikkeliksi. 

Varhaisempi samankaltainen kehitys on havaittavissa suomen ver- 
bin preesenstaivutuksessa (minä menen, sinä menet, hän menee), jonka 3. 
persoonan muodot ovat alun alkujaan olleet nominaalimuotoja. Ne ovat 
vastanneet nykykielen partisiippeja ja johdoksia tyyppiä menevä, menijä. 
Lauseessa hän menee on siis ollut ns. nominipredikaatti, ja se on tulkittu 
‘han on menevä’. 

Reanalyysille läheistä sukua on ilmiö, jossa affiksit saavat uusia 
merkityksiä, kun niitä käytetään uudessa kontekstissa. Esimerkiksi 
suomen genetiivin -n-pääte, joka on ilmaissut omistamista, on kehit- 
tynyt instruktiivin päätteeksi lauseyhteyksissä, joissa se on nominin 
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asemesta liittynyt verbiin (vrt. oikean jalan kenkä > jalan kulkea). Pääte 
on siis sama, mutta se saa erilaisen tulkinnan uudessa lauseopillisessa 
yhteydessä, ja näin syntyy uusi sijapääte. Vastaavasti monissa suomen 
sukukielissä, esimerkiksi permiläisissä kielissä komissa ja udmurtissa, 
on possessiivisuffikseista kehittynyt määräisyyden tai topikaalisuuden 
merkitsin, joka vastaa funktioltaan englannin määräistä artikkelia. Kun 
sanotaan esimerkiksi juo tuo teesi (komin Caj-yd ju!), ei possessiivisuffiksi 
enää viittaakaan omistamiseen vaan lauseyhteydessään määräiseen tai 
topikaaliseen kupilliseen teetä. 

Syntaksissa kuten sanastossakin lainautuminen on yleistä, vaik- 
ka lainaperäinen rakenne tulee mukauttaa kielen järjestelmään. Esi- 
merkiksi suomen sivulauserakenteet ovat hyvin samantyyppisiä kuin 
naapurikielissä ruotsissa ja venäjässä sekä balttilaisissa kielissä yhtäältä 
ja eroavat monista sisä Venäjän uralilaisista sukukielistämme toisaalta. 
Voikin olettaa, että kyseessä ovat osittain lainaperäiset, kielikontaktissa 
kopioituneet rakenteet. Näihin kuuluvat sivulauseiden ilmaiseminen 
konjunktioiden avulla infiniittisten rakenteiden ja lauseenvastikkeiden 
asemesta ja ns. perifrastiset aikamuodot eli olla-verbistä ja verbin nomi- 
naalimuodosta koostuvat perfekti ja pluskvamperfekti. 


8. Semanttinen muutos 


Sekä periytyviin että lainautuviin kielen elementteihin liittyy paitsi ään- 
teellinen muutos myös merkitysmuutos. Merkityksenmuutoksen tutki- 
musta on pitkään pidetty huomattavasti vaikeampana kuin äänteellisen 
muutoksen tutkimusta. 

Äänteenmuutokset toistuvat samankaltaisina kielestä toiseen, mutta 
merkityksenmuutoksissa on paljon ainutkertaisiin kulttuurikontekstei- 
hin liittyvää. Esimerkiksi Casanova oli italialainen aatelismies, mutta hä- 
nen nimestään on tullut huikentelevaa naistenkaatajamiestä tarkoittava 
käsite. Ruotsin stycke 'osa, kappale taas on lainattu suomeen sanana tyk- 
ki, joka tarkoittaa ampuma-asetta. Ilmeisesti merkityksenmuutos johtuu 
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ranskalaisesta tavasta kutsua tykistön tykkejä 'osiksi' (piece d'artillerie), 
mikä on vaikuttanut Ruotsin armeijan puhekäytäntöihin. Ruotsin ar- 
meijassa palvelleiden tykkimiesten mukana sana on kulkeutunut suo- 
meen alkuperäistä paljon rajatummassa merkityksessä. Vastaavia merki- 
tyksenmuutoksia, jotka voidaan ymmärtää vain kulttuurikontekstissaan, 
tunnetaan kaikista maailman kielistä. Eräät niistä ovat kansainvälisiä. 
Esimerkiksi italian sana fiasco 'pullo' kuvaa yleisesti epäonnistumista 
eurooppalaisissa kielissä. Ilmeisesti ilmaus on levinnyt italiankielisestä 
ilmauksesta fare il fiasco, ’maksaa pullo”, joka on ollut korttipelin kierrok- 
sen häviäjän kallis velvollisuus. 

Huolimatta merkityksenmuutoksen kulttuuri- ja kontekstisidonnai- 
suudesta on myös merkityksenmuutoksissa paljon säännönmukaisuut- 
ta. Jo varhain on esimerkiksi havaittu, että kielen sanaston eräät osat 
ovat huomattavasti alttiimpia merkityksenmuutoksille kuin toiset. Siinä 
missä perusliike- ja havaintoverbit (tulla, mennä, nähdä, kuulla), säätä tai 
luonnonilmiöitä kuvaavat sanat (kivi, tuuli, vesi) tai ruumiinosien nimi- 
tykset (käsi, jalka, pää) ovat yleensä vanhoja ja merkitykseltään melko 
muuttumattomia, muuttuvat mielentiloja, teknologioita, raaka-aineita, 
uskontoa ja muita kulttuuri-ilmiöitä koskevat sanat historiassa suhteelli- 
sen nopeasti. Fräisiin tunne-elämyksiin, kuten rakastumiseen ja huma- 
laan, liittyvä sanasto muuttuu jopa yhden sukupolven aikana (humalassa 
> kännissä > tuiterissa > kaasussa). 

Keskeisiä merkityksenmuutoksen tyyppejä ovat mm. merkityksen 
laajeneminen ja merkityksen supistuminen. Suomen kielen kulkea on 
syntynyt sanasta, joka useimmissa uralilaisissa kielissä merkitsee ve- 
den virtaamista. Sanan merkitys on siis laajentunut merkitsemään mitä 
hyvänsä kulkemista. Vastaavasti suomen kuori-sanan vastineet etäsuku- 
kielissä tarkoittavat lähinnä puun kuorta tai tuohta. Tässäkin näemme 
merkityksen laajentuvan kaikenlaisiin kuoriin. Yleisempää on kuitenkin 
merkityksen supistuminen. Esimerkiksi suomen otsa-sanan vastineet 
sukukielissä tarkoittavat edessä olevaa”. Suomessa on siis tapahtunut 
merkityksen supistuminen tarkoittamaan ainoastaan yhtä edessä olevaa 
asiaa. Vastaavasti suomen saarnata näyttää merkinneen alkuaan kaiken- 
laista puhumista, mikä ilmenee edelleen esimerkiksi karjalassa, inarin- 
saamessa ja komissa. Sanan merkitys on siis supistunut merkitsemään 
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yhtä tiettyä puheen tyyppiä. Merkityksen supistumista tapahtuu helposti 
erityisesti lainautumisen yhteydessä. 

Keskeinen merkityksenmuutosten mekanismi on sanan merkityksen 
metaforistuminen eli kuvaannollinen käyttö. Sellaiset aivan tavalliset 
sanat kuin käsittää, tietää ja päätellä ovat metaforaan perustuvia johdok- 
sia sanoista käsi, tie ja pää. Niiden merkitysten voi katsoa olevan jotakin 
sellaista kuin 'ottaa kädellä kiinni, ”kulkea tietä pitkin ja 'kulkea päähän 
asti”. Metaforistumista voi usein havaita myös lainasanoissa. Esimerkiksi 
venäjän sanasta stradat’ 'kársià' on lainattu karjalan ruadua ja suomen 
raataa tehdä työtä”. Suomen känni taas on saatu alun perin ruotsalaises- 
ta kannua merkitsevästä sanasta. 

Metafora on varsin usein taustalla myös kieliopillisen merkityksen 
syntymisessä. Niinpä esimerkiksi sana pää on tuottanut varsin monia 
kieliopillisia rakenteita. Tien päässä ja pöydän päällä oleva asia on pää- 
hän rinnastettavissa olevassa metaforisessa suhteessa tilaan. Toisaalta 
silloin kun televisio tai pesukone pannaan päälle, on kyse ruotsin kieles- 
tä saadusta syntaktisesta lainasta. Ruotsissa päällä oleva televisio on pä 
”päällä”, joka on ollut metafora. Mahdollisesti kyseessä on ollut alun pe- 
rin esimerkiksi valon asettaminen pöydälle tai pöydän yläpuolelle, jotta 
se valaisisi koko tilan. Tästä valon nostamisesta on sitten saatu television 
ja muiden sähkölaitteiden käynnistämiseen liittyvä päälle panemisen 
metafora. Metaforisesti käytetään kieliopillistuneissa rakenteissa usein 
myös sanoja juuri (esim. vuoren juurella), ääri 'reuna' (pöydän ääreen), 
käsi (esim. asia on johtajan käsissä), hammas (esim. hän joutui vastustajien 
hampaisiin) jne. 


9. Typologia ja historiallinen kielitiede 


Kun kielitypologian tutkimus on 2000-luvulla vauhdittunut, tämä on 
vaikuttanut myös historiallis-vertailevaan kielentutkimukseen. Monien 
eri kielten sanastoa kuvaavia typologisia tietokantoja on luotu histo- 
rialliseenkin tutkimukseen soveltuvaksi materiaaliksi. Esimerkiksi ns. 
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leksikaalisia assosiaatioita tai kollokaatioita koskeva tutkimus on laajalti 
selvittänyt, mitkä käsitteet liittyvät toisiinsa maailman kielissä (esim. 
rakkaus, sydän ja punainen väri, tai lehti, sappi, vihreä väri ja kateus 
länsimaisessa kulttuuripiirissä). Tällaiset assosiaatiot voivat johtaa mer- 
kityksenmuutoksiin sekä toisaalta heijastua sanojen synnyssä johdoksi- 
na (List, Greenhill, Anderson, Mayer, Tresoldi & Forkel 2018; Vanhove 
2008). 

Martin Haspelmathin ja Uri Tadmorin laaja maailman lainasanoja 
koskeva tutkimus (Haspelmath & Tadmor 2009) osoitti, miten eri 
käsitepiireihin liittyvä sanasto lainautuu — ja täten myös muuttuu — 
aivan eri todennäköisyydellä. Tutkimuksessa havaittiin, että nominit 
ovat helpommin lainautuvia kuin verbit ja että kieliopillista merkitystä 
kantavien sanojen lainautuminen oli yli kaksi kertaa epätodennäköi- 
sempää kuin tavallisen sanaston lainautuminen. Todennäköisimmin 
lainautuvaksi havaittiin uskontoon ja teknologiaan liittyvä sanasto. Vä- 
hiten todennäköisimmin taas lainautui liikkeeseen ja fysikaaliseen to- 
dellisuuteen liittyvä sanasto. 

Koleksifikaatioita eli samalla sanalla nimitettäviä asioita ja tähän 
liittyvää merkityksenmuutosta koskevaa tietoa on yhdistelty semant- 
tisten muutosten tietokannassa (Bulakh, Ganenkov, Gruntov, Maisak, 
Rousseau & Zalizniak 2012-2017), johon on koottu eri lähteistä tiedossa 
olevia semanttisia muutoksia. Tämäntyyppiset tietokannat voivat tule- 
vaisuudessa muuttaa myös merkityksenmuutoksen tutkimuksen lähes 
samanlaiseksi täsmätutkimukseksi kuin, mitä äänteenmuutosten tut- 
kimus on. 

Viime vuosikymmeninä historiallis-vertailevaa metodia on täydennet- 
ty myös tietokoneavusteisilla menetelmillä, jotka esimerkiksi laskevat 
kielten välisiä etäisyyksiä samankaltaisten sanojen avulla (vrt. esim. Syr- 
jänen, Honkola, Korhonen, Lehtinen, Vesakoski & Wahlberg 2013) tai 
etsivät sanoja, joissa on tapahtunut säännöllisiä muutoksia. Tietokone- 
avusteisilla ohjelmilla on pyritty myös etsimään perinteisiä kantakieliä 
suurempien aikasyvyyksien välisiä yhteyksiä eri kielikuntien välillä, mut- 
ta läpimurtoa ei alalla ole saavutettu. 
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10. Yhteenveto 


Historiallis-vertaileva kielitiede tutkii sanojen, morfeemien ja rakentei- 
den historiaa vertailemalla nykykielia ja kirjallisesti tunnettuja vanhoja 
kielimuotoja. Se selittää nykykielten variaatiota projisoimalla ne men- 
neisyyden vaihtelemattomaan kantakieleen. Kantakielen jakautumi- 
nen moniksi kieliksi on monta kertaa historiassa toistunut tapahtuma. 
Esimerkiksi latina on romaanisten kielten kantakieli. Rekonstruoidut 
kantakielet ovat historiallisesti todella olemassa olleita kieliä, joista ei 
kuitenkaan tiedetä kovin paljoa. 

Historiallis-vertailevan metodin perusolettama on, että kielen kehi- 
tys on äänteellisesti säännöllistä. Myös kielen muotojen ja merkitysten 
kehityksessä on paljon säännönmukaisuutta, vaikkakaan säännön- 
mukaisuus ei ole aivan yhtä suurta kuin äänteistön kehityksessä. 

Historiallis-vertailevan metodin avulla on mahdollista tutkia myös 
niitä kielen elementtejä, jotka kantakielten asemesta on saatu naapuri- 
kielistä lainaamalla. Lainautuminen voi kohdistua sekä sanastoon, muo- 
toihin että rakenteisiin. Metodi pystyy rakentamaan kielten sisäisten ja 
ulkoisten vaikutusten aikahierarkioita, joita voi kuvata esim. sukupuilla. 
Sen avulla on mahdollista erottaa toisistaan eri-ikäiset lainavaikutukset 
ja tätä tietoa on mahdollista edelleen soveltaa esihistorian tutkimukseen. 

Historiallis-vertaileva metodi oli 1800-luvun alkupuolelta lähtien 
kielitieteen keskeinen metodi, mutta 1900-luvun jälkipuoliskolla se 
muuttui marginaalisemmaksi. Metodia on kuitenkin jatkuvasti täy- 
dennetty mm. kielitypologian näkökohtia huomioimalla. Suurinta osaa 
maailman kielikunnista ei ole kovinkaan syvällisesti tutkittu historiallis- 
vertailevasta näkökulmasta. 
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1. Johdanto: mitä antropologinen lingvistiikka 
on? 


Antropologia tieteenalan nimityksenä tarkoittaa sananmukaisesti "oppia" 
(kr. -logia) ”ihmisestä” (kr. ánthrópos). Ihmistä voidaan tutkia fyysisenä 
lajina (fyysinen antropologia), kulttuuria luovana ja kantavana olentona 
(kulttuuriantropologia) tai myös yhteisöjä rakentavana ja ylläpitävänä 
ryhmän jäsenenä (sosiaaliantropologia). Koska ihmisen tärkein ominai- 
suus sekä kulttuurin että yhteisöllisyyden kannalta on kieli, myös kieltä 
voidaan tutkia antropologian kannalta ja antropologian menetelmin. 
Tätä tutkimusta tekee antropologinen lingvistiikka. 

Antropologinen lingvistiikka on siis kielitieteen osa-alue, joka on 
kiinnostunut kielen kulttuurisesta ja sosiaalisesta merkityksestä. Kult- 
tuuriset ja sosiaaliset ilmiöt näkyvät aina sekä kielen substanssissa että 
rakenteessa — sanastossa ja kieliopissa — mutta myös kielen kontekstis- 
sa — kieliyhteisön rakenteessa, historiassa ja kontakteissa muiden kieli- 
yhteisöjen kanssa. Aika ja paikka ovat keskeisiä kielen antropologisen 
kontekstin ymmärtämiseksi. Hyvin erityyppisen näkökulman kieleen 
verrattuna antropologiseen lingvistiikkaan muodostavat esimerkiksi eri- 
laiset kielen formaalit teoriat, joiden avulla kieliä voidaan kuvata järjes- 
telminä riippumatta niiden kontekstista. 

Koska kulttuurit ja ihmisyhteisöt voivat olla keskenään hyvin erilai- 
sia, antropologisessa lingvistiikassa korostuu kielten erilaisuus eli diver- 
siteetti. Maapallolla puhutaan tällä hetkellä noin 6 000-7 000 kieltä, 
ja antropologinen lingvistiikka kohdistaa huomionsa erityisesti niihin 
maailman kieliin, joita ei vielä ole kuvattu tai edes luokiteltu ja jotka li- 
säksi ovat nopeassa tahdissa katoamassa kolonialismin ja globalisaation 
aiheuttamassa yleismaailmallisessa murroksessa. Vaikka antropologinen 
lingvistiikka voi hyödyntää yleisten kieliteorioiden ja kielitypologian luo- 
mia malleja, se pyrkii näkemään näiden taakse ja löytämään ne konteks- 
tuaaliset ominaisuudet, jotka tekevät kustakin kielestä ainutkertaisen. 

Antropologinen lingvistiikka tutkii myös sitä, kuinka kieltä käytetään 
suhteessa kielten sisäiseen ja ulkoiseen variaatioon. Hyvin suuri osa ih- 
miskunnasta käyttää päivittäin useita kieliä tai kielimuotoja — murteita, 
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tyylejä ja rekistereitä —, ja tämän moninaisuuden takana on monen- 
laisia sosiaalisia, esimerkiksi etnisyyteen, sukupuoleen, kulttuuriin ja 
yhteiskuntarakenteisiin liittyviä tekijöitä. Näitä tekijöitä eivät formaalit 
kieliteoriat tai kognitiivinen lingvistiikka yleensä huomioi, mutta ne 
kuuluvat erityisesti antropologisen lingvistiikan kompetenssiin. Tämä 
merkitsee samalla sitä, että antropologinen lingvistiikka on luonteeltaan 
monitieteistä ja tieteidenvälistä tutkimusta: siinä yhdistyvät kielitieteen, 
kulttuurientutkimuksen ja yhteiskuntatieteiden menetelmät. 

Antropologinen lingvistiikka ei ole kuitenkaan alana täysin yhtenäi- 
nen, vaan sen sisällä on erilaisia painotuksia, ja myös sen ulkoiset rajat 
muihin tieteisiin ovat liukuvat. Näitä eroja ja rajoja heijastavat ne eri- 
laiset termit, joilla tutkijat operoivat. Seuraavassa tarkastellaan antropo- 
logisen lingvistiikan suhdetta joihinkin lähialoihin. 

Antropologinen lingvistiikka ja lingvistinen antropologia. Antropo- 
logisen lingvistiikan rinnalla puhutaan usein lingvistisestä antropologias- 
ta. Vaikka näitä termejä voidaan käyttää samassa merkityksessä, niiden 
välillä voidaan nähdä myös painotusero. Antropologille kieli on ennen 
kaikkea väline, jonka kautta voidaan lähestyä kulttuurin ja yhteiskunnan 
rakenteita, kun taas lingvistille kieli on varsinainen tutkimuskohde, jos- 
sa näkyvät ympäröivän kulttuurin ja yhteiskunnan rakenteet. Joidenkin 
tutkijoiden mielestä on ylipäänsä turha puhua lingvistisestä antropo- 
logiasta, koska kieli ihmisen lajiominaisuutena kuuluu aina antropo- 
logian piiriin. Toiset taas pitävät myös antropologista lingvistiikkaa ensi- 
sijaisesti antropologiana, koska erityisesti anglosaksista lingvistiikkaa 
ovat viime vuosikymmeninä dominoineet antropologialle vieraat uni- 
versalistiset ja formalistiset näkemykset. 

Selvästi antropologian piiriin kuuluvat joka tapauksessa ne kysymyk- 
set, jotka liittyvät kieleen ihmisen lajiominaisuutena. Nykyään puhut- 
tavat kielet antavat vain hyvin kapean näkökulman ihmiskielen esihis- 
torialliseen taustaan. Kieli on ollut olemassa ehkä jo satoja tuhansia 
vuosia, ja sen fyysistä alkuperää voi tutkia lähinnä vain fossiililöydöistä 
tehtyjen johtopäätösten avulla (paleoantropologia). Arviot muinaises- 
ta kielidiversiteetistä edellyttävät myös ennen kaikkea antropologista 
tietoa ihmisyhteisöjen koosta, sijainnista ja elintavoista. Varsinainen 
antropologinen lingvistiikka liikkuu yleensä lähempänä nykyaikaa tai 
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suorastaan nykyajassa, jolloin kieltä voidaan havainnoida sen välittömäs- 
sä kulttuurisessa ja sosiaalisessa kontekstissa. 

Antropologinen lingvistiikka ja etnolingvistiikka. Antropologisen 
lingvistiikan synonyyminä käytetään usein myös termiä etnolingvistiikka. 
Etnolingvistiikka viittaa sananmukaisesti etnisyyteen ja etnisiin ryhmiin 
(kr. éthnos), ja koska yksi antropologisen lingvistiikan painopistealueista 
on tyypillisesti pienten etnisten ryhmien aikaisemmin tutkimattomien 
kielten kartoitus ja dokumentaatio, etnisyyteen viittaaminen on paikal- 
laan. Kyse on kuitenkin myös terminologisten traditioiden erosta: et- 
nisten ryhmien tutkimus tunnetaan varsinkin Euroopassa perinteisesti 
”etnologiana”, kun taas Pohjois-Amerikassa puhutaan useammin ”antro- 
pologiasta” (tarkoittaen erityisesti kulttuuriantropologiaa). 

On kuitenkin hyvä muistaa, että sekä lingvistinen antropologia että 
antropologinen lingvistiikka voivat tutkia myös muita kuin kielen etni- 
siä ulottuvuuksia. Esimerkiksi suurkaupunkien sosiaalisen diversiteetin 
tutkimuksesta puhutaan usein urbaanina antropologiana, ja myös antro- 
pologinen lingvistiikka voi tutkia kielten kontekstuaalisia ulottuvuuksia 
etnisyydestä riippumatta. Tältä kannalta etnolingvistiikka on parhaiten 
ymmärrettävissä antropologisen lingvistiikan alalajina, jossa huomio 
kiinnitetään nimenomaan kielen ja etnisyyden yhteyksiin. Tämä on si- 
nänsä tärkeä yhteys, koska kieli on kiistämättä tärkein etnistä identiteet- 
tiä ylläpitävä tekijä. 

Antropologinen lingvistiikka ja sosiolingvistiikka. Koska antropologi- 
nen lingvistiikka tarkastelee kieltä suhteessa kieliyhteisöön ja sen sosiaa- 
lisiin rakenteisiin, se on tutkimusalana lähellä myös sosiolingvistiikkaa. 
Kieliyhteisön koko ja sosiaalinen koostumus, muun muassa puhujien 
ikä- ja elinkeinorakenne sekä liikkuvuus, vaikuttavat olennaisella tavalla 
siihen, miten kieli elää ja toimii ympäristössään, ja tämän vaikutuk- 
sen tutkimus kuuluu luonnostaan antropologisen lingvistiikan piiriin. 
Enemmän kuin "puhtaassa" sosiolingvistiikassa antropologisessa ling- 
vistiikassa korostuvat kuitenkin kielen sosiaalisen variaation kulttuuriset 
ja etniset taustatekijät. 

Sosiolingvistiikan kehittämiä metodeja voidaan joka tapauksessa me- 
nestyksellisesti hyödyntää antropologisessa lingvistiikassa, eikä jyrkkää 
rajaa näiden lähestymistapojen välille voida vetää (ks. Sosiolingvistiikka 


724 EKATERINA GRUZDEVA JA JUHA JANHUNEN 


tässä kirjassa). Antropologisen lingvistiikan sosiolingvistiset ulottuvuu- 
det sivuavat jossain määrin myös psykolingvistiikkaa, mutta tutkimus- 
alana psykolingvistiikka on kauempana antropologisesta näkökulmasta 
ja kuuluu enemmän kognitiivisen kielentutkimuksen kenttään. Psyko- 
lingvistiikka tutkii ennen kaikkea kielen suhdetta kognitiivisiin proses- 
seihin (ajatteluun), eivätkä kielen kulttuuriset ja sosiaaliset ulottuvuudet 
tyypillisesti ole mukana sen kysymyksenasetteluissa. 

Antropologinen lingvistiikka ja ekolingvistiikka. Vasta varsin hiljat- 
tain antropologisen lingvistiikan rinnalle on kehittynyt ekolingvistiikka- 
na tunnettu tutkimussuuntaus, jota on kehittänyt mm. Australiassa vai- 
kuttava saksalainen lingvisti Peter Mithlhausler (1996). Ekolingvistiikka 
eli lingvistinen ekologia ottaa keskeisen näkökulmansa ekologiasta, joka 
tutkii erityisesti luonnonympäristön rakenteita. Ekolingvistiikka on ala- 
na lähellä sosiolingvistiikkaa mutta eroaa siitä muun muassa sikäli, että 
se ottaa kielen sosiaalisen ympäristön lisäksi huomioon myös fyysiset 
ympäristötekijät, esimerkiksi ilmaston ja kasvillisuuden, joilla puoles- 
taan on suora vaikutus kieliyhteisön kulttuuriin, elinkeinorakenteeseen 
ja kokoon. 

Ekolingvistiikka tarjoaa antropologiselle lingvistiikalle erityisen 
käyttökelpoisia malleja kielten historiallisen leviämisen, jakautumisen, 
vuorovaikutuksen ja viime kädessä uhanalaisuuden tutkimukseen. Kie- 
let muodostavat, kuten elävän luonnon lajit, ekologisia järjestelmiä, joi- 
den pysyvyydelle on olennaista tasapainon säilyminen. Fkolingvistiikka, 
yhtä vähän kuin antropologinen lingvistiikkakaan, ei kuitenkaan välttä- 
mättä ota kantaa tasapainon säilymisen puolesta, vaan se voi yhtä hyvin 
tutkia niitä tilanteita, joissa tasapaino horjuu. 


2. Antropologisen lingvistiikan taustaa 


Antropologinen lingvistiikka on kehittynyt yhdessä muun kielitieteen 
kanssa, ja on vaikea sanoa, missä sen varsinaiset juuret ovat. Voidaan 
jopa ajatella, että lähes kaikki sellainen kielentutkimus, joka hakee 
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aineistonsa puhutuista kielistä, on antropologista lingvistiikkaa riippu- 
matta siitä, millä nimellä tällaista tutkimusta kulloinkin on kutsuttu. 
Puhuttuja kieliä taas on ainakin eurooppalaisessa kontekstissa tutkittu 
jo vähintään löytöretkien ja reformaation ajoista alkaen. 

Amerikkalainen antropologia. Usein antropologisen lingvistiikan kat- 
sotaan olevan lähtöisin 1800-luvun lopun pohjoisamerikkalaisesta antro- 
pologiasta, joka alkoi tutkia intiaanikansoja ja niiden kieliä — samalla 
kun intiaaniheimoja systemaattisesti tuhottiin Yhdysvaltain laajentues- 
sa kohti länttä. Tämän tutkimuksen pioneerina ja koko antropologian 
pohjoisamerikkalaisen koulukunnan perustajana tunnetaan Franz Boas 
(1858-1942), jonka johdolla valmistui muun muassa massiivinen teos- 
sarja Handbook of American Indian Languages (Boas 1911-1922). Boasin 
koulukuntaan liittyivät myös venäläiset Vladimir Bogoraz (1865-1936) 
ja Vladimir Jochelson (1855-1937), joiden tutkimuskohteena olivat Koil- 
lis-Siperian kansat ja kielet. 

Boasin koulukunta korosti alusta alkaen sitä, ettei ole olemassa "pri- 
mitiivisiä” kieliä tai kansoja, vaan kaikki kielet ja kulttuurit ovat omalla 
tavallaan yhtä kompleksisia. Samalla ymmärrettiin, että kaikki kielet ja 
kulttuurit ovat keskenään hyvin erilaisia, ja tämän erilaisuuden kartoitta- 
miseksi ne tuli perusteellisesti dokumentoida. Dokumentaatio tapahtui 
kenttätyön avulla välittömässä kontaktissa kielen puhujiin, ja kenttätyötä 
pyrittiin tekemään erityisesti sellaisilla alueilla ja sellaisten kielten pa- 
rissa, joita vielä ei ollut kuvattu. Näitä alueita olivat Pohjois-Amerikan li- 
säksi erityisesti Keski- ja Etelä-Amerikka mutta myös Australia, Oseania, 
Afrikka sekä suuret osat Aasiaa — alueita, jotka kaikki ovat nykyäänkin 
antropologisen lingvistiikan keskeisiä kohteita. 

Boasin koulukunnalle oli — ja on — ominaista myös neopositivistinen 
käsitys siitä, että empiirisesti ”aitoa” kieliainesta on ainoastaan se, joka 
on kielenpuhujan spontaanisti tuottamaa ja puhujalta suoraan doku- 
mentoitua. Tältä pohjalta tutkimus keskittyi erityisesti tekstimuotoisten 
kielennäytteiden keräämiseen. Teksteistä voitiin poimia esimerkkejä 
sekä sanaston että kieliopin tutkimukseen, ja niitä voitiin käyttää myös 
lähteinä kulttuuria lähestyttäessä. Ylipäänsä kielen ja kulttuurin tutki- 
musta ei boasilaisessa käsityksessä eroteta toisistaan, koska tutkimuk- 
sessa lähdetään siitä, että kulttuuria voi tutkia vain kielen kautta ja että 
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kielessä joka tapauksessa heijastuvat puhujien edustaman kulttuurin 
ominaisuudet. 

Eurooppalainen etnologia. On kuitenkin virhe pitää antropologista 
lingvistiikkaa yksinomaan pohjoisamerikkalaisena ”keksintönä”, sillä 
ala on ollut pitkään tunnettu ja harrastettu myös Euroopassa. Boasin 
eurooppalaisena vastineena pidetään usein Englannissa vaikuttanutta 
puolalaista Bronistaw Malinowskia (1884-1942), jonka kohdealuee- 
na olivat Tyynenmeren saaret, mutta hänen rinnallaan on mainittava 
niin ikään Englannissa uransa luonut suomenruotsalainen Edward 
Westermarck (1862—1939), joka teki kenttätyönsä Pohjois-Afrikassa. 
Malinowski ja Westermarck kuuluvat eittämättä modernin etnologian 
perustajahahmoihin, mutta myös heillä oli merkittävä edeltäjä, Austra- 
liassa toiminut venäläinen Nikolai Miklukho-Maklai (1846-1888), joka 
yhtenä ensimmäisistä kartoitti kentällä Tyynenmeren kansoja. 

On tosin jossain määrin kyseenalaista, voidaanko sen paremmin poh- 
joisamerikkalaisia antropologeja kuin eurooppalaisia etnologejakaan pitää 
nimenomaan lingvistisen antropologian edelläkävijöinä, sillä heille kaikil- 
le kieli oli ensi sijassa vain väline, jonka kautta päästiin tutkimaan kult- 
tuurin syvempiä rakenteita. Sinänsä on selvää, että kulttuuria tai sosiaali- 
sia rakenteita ei voi tutkia ilman niitä kannattavan yhteisön kieltä, mutta 
kielentutkimus eroaa kulttuurientutkimuksesta juuri siinä, että sille kieli 
ei ole väline vaan varsinainen tutkimuskohde. Voi sanoa, että kulttuurien- 
tutkimus on parhaimmillaankin vain välineellistettyä kielentutkimusta. 

Kielitieteilijät lähetystyössä. Eräänlaista välineellistettyä kielentutki- 
musta edustaa myös se traditio, jonka perimmäisenä tarkoituksena on 
uskonnon levittäminen ja sen kautta kulttuurisen yhdenmukaisuuden 
edistäminen. Kristilliset lähetyssaarnaajat ovat jo vuosisatoja, aluksi ko- 
lonialismin ja nyttemmin globalisaation hengessä, kartoittaneet maail- 
man kielellistä moninaisuutta voidakseen levittää sanomaansa myös 
sellaisille kansoille, joiden kielillä ei ole kirjallista perinnettä. Tätä toi- 
mintaa ovat harjoittaneet kaikki kristilliset suuntaukset, mutta erityisen 
vahvaksi sen asema on muodostunut Pohjois-Amerikassa syntyneiden 
protestanttisten liikkeiden ja vapaakirkollisten suuntausten keskuudes- 
sa. Esimerkiksi suomalaisen afrikanistiikan perinne on syntynyt lähes 
yksinomaan tältä pohjalta. 
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Uskonnollispohjaista kielentutkimusta ei ole syytä vähätellä, sillä se on 
vuosikymmenien ajan, erityisesti juuri Pohjois-Amerikassa, ylläpitänyt 
antropologisen lingvistiikan traditiota, samalla kun muu kielitiede on pai- 
nottunut voimakkaammin universalistisen ja kognitiivisen tutkimuksen 
suuntaan. Valtaosa aikaisemmin tutkimattomien kielten kuvauksista syn- 
tyy nykyäänkin kristillisten yhteisöjen tuella ja rahoituksella. Keskeinen 
rooli tässä toiminnassa on ”Kielitieteen kesäkoululla” (Summer Institute 
of Linguistics eli SIL International), joka systemaattisesti kouluttaa kieli- 
tieteellisesti päteviä lähetystyöntekijöitä eri puolille maailmaa. Tunnetuin 
tämän koulun kasvateista oli Kenneth L. Pike (1912-2000), jota voi perus- 
tellusti pitää yhtenä antropologisen lingvistiikan suurista nimistä. 

Suomalainen etnolingvistiikka. On monia syitä korostaa Suomen mer- 
kitystä antropologisen lingvistiikan historiassa. Suomalaisilla tutkijoilla 
oli Venäjän yhteydessä poikkeuksellisen hyvät mahdollisuudet tutkia 
Venäjän ja Siperian kielellistä moninaisuutta, ja tähän oli myös hyvät 
syyt, sillä haluttiin löytää suomalaisten kielisukulaiset ja määrittää ”Suo- 
men suvun” rajat. Tästä tutkimusperinteestä, jonka keskeisenä metodina 
oli kielitieteellinen kenttätyö, nousivat Suomen ”kansalliset kielitieteet? 
uralistiikka (fennougristiikka) sekä myös altaistiikka, jotka myöhemmin 
levisivät maailmalle ja tulivat osaksi kansainvälistä kielentutkimusta. 

Suomalaisen etnolingvistiikan perustajina voi pitää Anders Johan 
Sjögreniä (1794-1855) ja Matthias Alexander Castrénia (1813-1852), joi- 
den tutkimat kielet yhdessä kattoivat suurimman osan Venäjän impe- 
riumia Kaukasiaa ja Siperiaa myöten. Tätä perinnettä jatkoi 1883 pe- 
rustetun Suomalais-Ugrilaisen Seuran tuella suuri joukko suomalaisia 
kielentutkijoita, jotka etnolingvistiikan hengessä dokumentoivat kentällä 
sekä kieliä että niiden konteksteja. Tyypillistä tälle vaiheelle oli, että ku- 
kin tutkija yleensä erikoistui vain yhteen kieleen tai kielihaaraan, kuten 
Artturi Kannisto (1874-1943) mansiin, K. F. Karjalainen (1871-1919) 
hantiin ja Toivo Lehtisalo (1887-1962) nenetsiin. Monipuolisempaa 
lähestymistapaa edustivat Kai Donner (1888-1935) ja G. J. Ramstedt 
(1873-1950), joista viimeksi mainittu tunnetaan nimenomaan modernin 
altailaisen kielentutkimuksen perustajana. 

Suomalainen etnolingvistiikka syntyi noin puoli vuosisataa ennen 
amerikkalaista antropologiaa, mutta koska sen tulokset julkaistiin 
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aikoinaan pääasiassa ruotsiksi ja saksaksi, se on tieteenhistoriassa jää- 
nyt angloamerikkalaisen tutkimuksen varjoon. Mielenkiintoista on, että 
myös suomalaiset tutkijat siirtyivät — Boasin koulukunnasta riippumatta 
— kohti neopositivistista empirismiä ja keskittyivät yhä enemmän teks- 
tien keruuseen ja yhä vähemmän kielen rakenteen kuvaukseen. Alan 
uranuurtajat Sjögren ja Castrén käyttivät vielä runsaasti myös elisitaatio- 
menetelmiä, minkä ansiosta he saattoivat kuvata kielioppia järjestelmäl- 
lisemmin ja täydellisemmin kuin pelkän tekstiaineiston varassa toimivat 
seuraajansa. 

Saksalainen humanismi. Suomalaisen etnolingvistiikan juuret puo- 
lestaan olivat saksalaisen humanismin pohjalta syntyneissä kielitieteen 
suuntauksissa, jotka johtivat historiallis-vertailevan kielentutkimuksen ja 
kielitypologian syntyyn (ks. Historiallinen ja vertaileva kielentutkimus; 


Kielitypologian menetelmät tk.). Tosin historiallis-vertaileva kielen- 
tutkimuskin mainitaan usein harhaanjohtavasti anglosaksien keksintönä 


William Jonesin (1746—1794) intialaisten ja eurooppalaisten kielten su- 
kulaisuutta koskevan lyhyen kannanoton johdosta, mutta alan varsinai- 
nen perustaja oli saksalainen sanskritisti Franz Bopp (1791-1867), joka 
1816 julkaisi systemaattisen esityksen sanskritin, persian, kreikan, lati- 
nan ja germaanisten kielten yhteisistä piirteistä (Bopp 1816). Tämä indo- 
eurooppalaisen kielentutkimuksen perusteos toimi lähtökohtana mui- 
den kielikuntien, myös uralilaisten kielten, vertailevalle tutkimukselle. 

Saksalaiseen humanismiin pohjautui viime kädessä myös tanskalai- 
sen Rasmus Raskin (1787—1832) työ. Rask kirjoitti suuren joukon kieli- 
oppeja sekä tunnetuista että vähemmän tunnetuista eurooppalaisista 
kielistä, muun muassa useista germaanisista ja romaanisista kielistä 
sekä pohjoissaamesta. Hän teki myös matkan Intiaan ja julkaisi kenttä- 
työhön perustuvia havaintoja joukosta intialaisia kieliä. Raskilla oli 
merkittävä rooli suomalaisen etnolingvistiikan historiassa, sillä hänen 
vierailunsa Suomessa 1818 innoitti Sjögreniä antautumaan kielitieteili- 
jän uralle. Myöhemmin hänen elämäntyönsä innoitti myös Castrenia. 
Kenttälingvisteinä sekä Sjögren että erityisesti Castren olivat kuitenkin 
Raskia huomattavasti merkittävämpiä. 

Jo ennen vertailevan kielentutkimuksen metodien muotoutumis- 
ta saksalaisen humanismin piiristä nousi kielitieteen kannaltakin 
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merkittäviä polyhistoreita ja filosofeja, kuten Johann Gottfried von 
Herder (1744-1803) ja Wilhelm von Humboldt (1767—1835). Teoksessaan 
kielen alkuperästä Herder (1772) painotti erityisesti kielen merkitystä 
ajattelun ja sen kautta kulttuurin perustana. Tästä oli vain lyhyt matka 
Humboldtin näkemykseen kielestä kansallisen identiteetin keskeisenä 
tunnusmerkkinä, mikä puolestaan oli lähtökohtana suomalaiselle etno- 
lingvistiikalle, joka kielen kautta etsi suomalaisuuden juuria. Humboldt 
korosti myös kielidiversiteetin tutkimuksen tärkeyttä. Hänen postuu- 
misti 1836 julkaistu johdatuksensa Jaavalla puhuttuun kawin kieleen on 
yksi antropologisen lingvistiikan klassikoista. 

Valistusajan kenttätyöperinne. Kielitieteellisen kenttätyön perinne 
ja kielidiversiteetin tutkimus saivat kuitenkin alkunsa jo valistusajalla, 
jolloin alettiin systemaattisesti kerätä aineistoa vähän tunnetuista kielis- 
tä eri puolilta maailmaa. Tälläkin alalla tutkimusta johtivat saksalaiset 
polyhistorit, joista monet olivat Venäjän tiedeakatemian palveluksessa ja 
keräsivät aineistoa Venäjän keisarikunnan kielistä eli lähes koko Keski- 
ja Pohjois-Euraasiasta. Kielet olivat tyypillisesti vain yksi dokumentaatio- 
kohde monien muiden joukossa, sillä samalla kuvattiin myös kulttuure- 
ja ja historiaa sekä luonnonympäristöä — muun muassa kasveja, eläimiä 
ja mineraaleja. Etnobotaniikka, joka tutkii kasveja suhteessa niitä käyt- 
tävien väestöjen kulttuureihin ja kieliin, on esimerkki tutkimusaloista, 
jotka versoivat valistusajan kenttätyöperinteestä. 

Varsinaisina kielitieteellisinä tuloksina valistusaika dokumentoi lä- 
hinnä sanastoa, harvoin kokonaisia fraaseja eikä juuri koskaan kieli- 
oppia. Varhaisen pioneerityön tekivät Venäjän Kiinan-lähettiläänä 
toiminut tanskalainen Eberhard Isbrand Ides (1657-1708), Venäjällä 
neuvonantajana toiminut hollantilainen Nicholaus Witsen (1641-1717) 
sekä Venäjälle sotavankina joutunut ruotsalainen Philip Johan von 
Strahlenberg (1676-1747), joiden kaikkien kuvaukset Pohjois- ja Keski- 
Aasiasta sisältävät myös kieliaineistoa. Ensimmäisen systemaattisen 
”koko maailman” kielten sanastokokoelman julkaisi Peter Simon Pallas 
(1741-1811), ja vastaavanlaisia sanastoja ilmestyi myöhemmin muitakin, 
muun muassa Julius Klaprothilta (1783-1835). Näissä sanastoissa kieliä 
ryhmiteltiin sekä geneettisesti että alueellisesti, ja tältä pohjalta alkoi 
vähitellen kirkastua kuva maailman kielikunnista ja myös kielialueista. 
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3. Antropologisen lingvistiikan menetelmia 


Koska antropologisen lingvistiikan kohteena ovat sekä kielet että nii- 
den kulttuuriset, sosiaaliset, alueelliset ja historialliset kontekstit, ala 
on perusluonteeltaan monitieteinen. Lähtökohtana on kuitenkin aina 
kulloinkin tutkittava kieli tai kielimuoto, jonka kielitieteellinen kuvaus 
on edellytyksenä sen kontekstin tutkimiselle. Kun sekä kieli että sen 
kontekstuaaliset ulottuvuudet on monipuolisesti kartoitettu, voidaan 
edetä analyysin tasolle ja tehdä esimerkiksi johtopäätöksiä kielen ja kieli- 
yhteisön historiasta sekä vertailuja eri kielten ja kieliyhteisöjen välillä. 
Kielitieteellinen kenttätyö. Lähes kaikki antropologinen lingvistiik- 
ka perustuu kenttätyön kautta hankittuun aineistoon ja sen analyysiin. 
Kenttätyön perusmenetelmät ovat samat riippumatta siitä, tutkitaanko 
kieltä vai sen kontekstia: tutkittava kohde dokumentoidaan mahdolli- 
simman perusteellisesti havainnoinnin ja haastattelujen kautta (ks. Kiel- 
ten dokumentointi ja kieliopin kuvaus tk.). Kohderyhmänä on yleensä 


kieliyhteisö, jonka parissa lingvisti viettää riittävästi aikaa voidakseen 
suorittaa dokumentoinnin monipuolisesti ottaen huomioon yhteisön 
sisällä vallitsevat sosiaaliset erot esimerkiksi sukupuolten ja ikäryhmien 
välillä. Kielen jonkinasteiseen dokumentointiin riittää kuitenkin hätäti- 
lassa yksikin puhuja, ja varsin monia kieliä onkin dokumentoitu vain 
yhden — usein viimeisen — puhujan avulla. Pelkän kielen dokumentointi 
on mahdollista myös laboratorioympäristössä, mutta kieliyhteisön ko- 
konaisprofiilin voi kartoittaa vain kentällä yhteistyössä kielenpuhujien 
kanssa. 

Koska vähänkään isomman kieliyhteisön kaikkia puhujia ei voida 
tavoittaa, lingvisti käyttää tyypillisesti apunaan pientä joukkoa kielen- 
oppaita (informantteja eli konsultantteja). Kielenoppaiden valinta on 
ensimmäinen tehtävä kenttätyötä aloitettaessa, ja se on syytä tehdä 
huolellisesti ottaen huomioon myös sen, että eri kielenoppaat saat- 
tavat soveltua erilaisiin tehtäviin. Esimerkiksi kieliopin tai sanaston 
keruu ei välttämättä onnistu samoilta kielenoppailta, jotka ovat hyviä 
kertojia ja folkloren taitajia. Eri ikä- ja sukupuoliryhmillä on usein 
erilainen kompetenssi kielessään, ja heillä saattaa olla myös erilainen 
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kaksikielisyysprofiili. Äärimmäisinä tapauksina ovat ryhmät, joissa eri 
sukupuolet puhuvat eri kieliä. 

Osallistuva havainnointi ja elisitointi. Ihannetapauksessa lingvisti 
saavuttaa käytännön taidon tutkimassaan kielessä eli pystyy käyttämään 
sitä suoraan kenttätyön apukielenä. Tässä piilee kuitenkin se vaara, että 
tutkija antaa oman kompetenssinsa vaikuttaa aineistoon. Tästä syystä 
apuna käytetään usein tutkijan ja kielenpuhujien yhteistä metakieltä 
— esimerkiksi Venäjän alueella venäjää, Kiinassa kiinaa ja Latinalaises- 
sa Amerikassa espanjaa tai portugalia. Metakielen käyttämisessäkin on 
kuitenkin ongelmansa, sillä sitä voidaan käyttää ainoastaan kaksikielis- 
ten puhujien kanssa ja sen tuoma interferenssi saattaa myös vaikuttaa 
kerättyyn kieliaineistoon. Joissakin tapauksissa kielentutkijan on paras 
pitäytyä mahdollisimman huomaamattomassa havainnoinnissa, jonka 
apuna voidaan käyttää myös teknisiä laitteita. Yksi mahdollisuus on 
antaa kielenoppaiden itsensä dokumentoida puhettaan ilman tutkijan 
välitöntä läsnäoloa. 

Viime kädessä kaikessa kielitieteellisessä kenttätyössä on tehtä- 
vä valinta passiivisen havainnoinnin ja aktiivisen kyselyn välillä. Niin 
sanotulla osallistuvalla havainnoinnilla (engl. participant observation) 
lingvisti — kuten antropologikin — kerää empiiristä aineistoa mahdol- 
lisimman monenlaisista konteksteista elämällä tutkimansa yhteisön 
sisällä neutraalina tarkkailijana. Tutkija pyrkii keräämään tutkimastaan 
kielestä mahdollisimman laajoja ja edustavia tekstejä. Muun muassa 
sanaston ja kieliopin kokonaisvaltainen dokumentaatio olisi kuitenkin 
mahdotonta ilman elisitaatiota eli kielenoppaille suunnattua tarkennet- 
tua kyselyä, jonka avulla voidaan täydentää muuten puutteellisiksi jää- 
viä tietoja kielen substanssista ja rakenteesta. Vaikka neopositivistinen 
kielentutkimus piti elisitaation kautta saatuja tietoja ”epääaitoina”, tiedot 
kielestä jäisivät poikkeuksetta puutteellisiksi ilman tätä menetelmää. 
Nykyään elisitaatiota voidaan menestyksellisesti käyttää myös internetin 
välityksellä. 

Kieliaineiston lisäksi antropologinen lingvisti kerää mahdollisimman 
monipuolista tietoa myös kielen kontekstista. Tätäkään tietoa ei välttä- 
mättä saa pelkällä havainnoinnilla, vaan apuna täytyy käyttää haastat- 
teluja. Haastattelut voivat koskea esimerkiksi kielen käyttötilanteita tai 
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yksilön henkilöhistoriaa, jolloin voidaan rakentaa niin sanottuja kielelli- 
siä elämäkertoja (engl. linguistic biographies) eli historiallisia kuvauksia 
siitä, miten ja missä yhteyksissä yksilö ja hänen lähipiiriinsä kuuluvat 
muut yksilöt ovat elämänsä aikana käyttäneet omaa kieltään ja muita 
kieliä ja miten tämä tilanne on muuttunut sukupolvesta toiseen. 

Tilastollinen tiedonkeruu. Yksi antropologisen lingvistiikan keskei- 
sistä tutkimuskohteista on kielen suhde kieliyhteisöön eli kieltä puhu- 
vaan väestöön. Kokonaiskuvan hankkiminen väestötason kielenkäytöstä 
edellyttää usein laajamittaista kyselyä, joka voidaan toteuttaa vain syste- 
maattisten ryhmähaastattelujen ja kyselykaavakkeiden avulla. Verrattuna 
yksilöiden yksityiskohtaisiin syvähaastatteluihin laajamittaiset kyselyt 
voivat antaa vain huomattavasti yleiskatsauksellisemman käsityksen 
kielestä ja sen käytöstä, mutta sen etuna on menetelmän suurempi kat- 
tavuus ja tiedon yleistettävyys. 

Laajamittaisen kyselyaineiston käsittely vaatii demografisten ja tilas- 
tollisten analyysimenetelmien käyttöä. Erityisesti demografia eli väestö- 
jen (kr. demos) tutkiminen on antropologisen lingvistiikan olennainen 
aputiede. Maailmassa tällä hetkellä puhuttujen kieliyhteisöjen demo- 
grafinen profiili on hyvin vaihteleva: on kieliä, joiden puhujia on satoja 
miljoonia, ja toisia, joita puhuu vain muutama yksilö. Valtaosalla maail- 
man kielistä on muutamasta sadasta muutamaan tuhanteen puhujaa. 
Tämä suuri vaihtelu, joka ilmenee myös puhujien kaksi- ja monikieli- 
syyden eroissa, tarjoaa haasteita tilastoaineiston keruulle ja käsittelylle. 
Mitä suurempi kieliyhteisö on, sitä vaikeampi siitä on luoda edes tilas- 
tollista kokonaiskuvaa. 

Aineiston tallentaminen. Klassinen ja edelleen käyttökelpoinen 
menetelmä tallentaa kenttätyössä tehtyjä havaintoja on kirjoittaa ne 
muistiin, mieluiten järjestelmällisellä tavalla ja tiiviissä yhteistyössä 
kielenoppaan kanssa. Aineiston segmenttirakenteen osoittamiseen 
käytetään yleensä vakiintuneita foneettisia tarkekirjoitusjärjestelmiä, 
kohdekielestä riippuen esimerkiksi kansainvälistä foneettista aakkostoa 
(International Phonetic Alphabet eli IPA) tai suomalais-ugrilaista tarke- 
kirjoitusta (Finno-Ugrian Transcription eli FUT). Monista sittemmin 
kadonneista kielimuodoista on jäljellä ainoastaan lingvistien tekemiä 
kenttämuistiinpanoja, ja suuri määrä tällaisia muistiinpanoja odottaa 
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edelleen arkistoissa käsittelijäänsä. Kaikki, varsinkaan varhaisemmat 
kenttätutkijat, eivät kuitenkaan ole käyttäneet yksiselitteistä foneet- 
tista notaatiota, minkä takia aineistot ovat jälkikäteen usein vaikeasti 
tulkittavissa. 

Koska kirjallisten muistiinpanojen luotettavuus riippuu aina niiden 
tekijän tarkkuudesta ja koska varsinkin tekstien muistiinpaneminen 
vaatii suurta nopeutta, alettiin jo 1800-luvun lopulla käyttää teknisiä 
äänentallennuslaitteita ja kokeellis-foneettisia apuvälineitä (ks. Kokeel- 
linen fonetiikka tk.). Vaikka nämä tarjoavat sen ilmeisen edun, että ai- 


neisto on myös muiden tutkijoiden ulottuvilla mahdollisimman alku- 
peräisessä muodossa, tallennusten litteroiminen jälkikäteen on hyvin 
työlästä ja vaatii tutkijalta joko erittäin hyvää kohdekielen taitoa tai uut- 
ta yhteistyötä kielenoppaan kanssa. Ongelmana on ollut myös se, että 
tallennusformaatit muuttuvat nopeasti eikä vielä hiljattain käytetyillä 
laitteilla tehtyjä tallennuksia voida välttämättä enää avata. Digitoiminen 
ei näytä tuovan tähän ongelmaan pysyvää ratkaisua, koska myös digi- 
toinnin formaatit vaihtuvat nopeassa tahdissa ja digitoitu aineistokin on 
altis fyysiselle kulumiselle. 

Joka tapauksessa yleinen suositus on nykyään, että kenttälingvistit 
käyttävät kenttätyössään audiovisuaalisia apuvälineitä. Näin saatu ai- 
neisto voidaan edelleen tallentaa avoimiin lingvistisiin tietojärjestel- 
miin, kuten eurooppalaiseen korpusprojektiin (European Distributed 
Corpora Project eli EUDICO), jolla puolestaan on oma äänne- ja 
muotorakenteen merkintää varten kehitetty visualisointijärjestelmän- 
sä (EUDICO Linguistic Annotator eli ELAN). Suomessa kieliaineis- 
toa voi tallentaa FIN-CLARIN-kielipankkiin, joka kuuluu laajempaan 
kansainväliseen kielitieteiden CLARIN ERIC -tutkimusinfrastruktuuriin 
(dokumentaatio- ja tallennusmenetelmistä lisää ks. Kielten dokumen- 
tointi ja kieliopin kuvaus tk.). 


Lingvistiset menetelmät. Varsinaisen kieliaineiston käsittelyyn antro- 
pologinen lingvistiikka käyttää tavanomaisia kielitieteellisen analyysin 
menetelmiä. Erotukseksi monien teoreettisten koulukuntien lähesty- 
mistavoista antropologinen lingvistiikka pyrkii kuitenkin minimoimaan 
teoreettisten ennakko-oletusten haitalliset vaikutukset. Kokemus osoit- 
taa, että monet kieliteoriat ovat ohimeneviä muotivirtauksia, joille on 
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tyypillista vaikea terminologia, liiallinen formalismi ja dogmatismi. 
Kun muotivirtaus on ohi, tällaiselta perustalta tehtyä kielen kuvausta 
on vaikea suhteuttaa yleiseen tietopääomaan. Tästä syystä antropologi- 
nen lingvistiikka — kuten myös kielitypologia — kuvaa kieliä mahdolli- 
simman yksinkertaisilla malleilla, jotka lisäksi ottavat huomioon kielten 
erilaisuuden. 

Antropologisen lingvistiikan kuvausmalliksi sopiikin parhaiten niin 
sanottu peruskielioppiteoria (engl. Basic Linguistic Theory), jossa operoi- 
daan vanhoilla tutuilla kielioppitermeillä (esimerkiksi muotoryhmien 
ja lauseenjäsenten nimet), yleisesti tunnetuilla perusteorioilla (esimer- 
kiksi fonologinen teoria) ja tavanomaisilla analyyttisillä metodeilla (esi- 
merkiksi morfologinen ja syntaktinen analyysi). Tätä teorianeutraalia 
kieliteoriaa on puolustanut erityisesti australialainen lingvisti R. M. W. 
Dixon (2009). Lähtökohtana on, että kieliaineiston hallinnan tulisi käy- 
dä teorioiden edellä. Tarkoituksena on saattaa aineisto sellaiseen muo- 
toon, että se on sekä eri lingvististen teorioiden kannattajien että tarvit- 
taessa myös ei-lingvistien helposti ymmärrettävissä. Näin analysoitua 
aineistoa voi tietysti myöhemmin käyttää myös monimutkaisemman 
teorianmuodostuksen pohjana. 

Filologiset menetelmät. Vaikka antropologisessa lingvistiikassa ai- 
neisto tyypillisesti kerätään kenttätyön avulla suoraan elävien kielten pu- 
hujilta, siinä voidaan hyödyntää myös kirjoitettuun muotoon tallennet- 
tuja kieliaineistoja, jolloin käytetään filologian menetelmiä. Erotukseksi 
lingvistiikasta filologia käsitetään usein tieteenalaksi, joka keskittyy kir- 
joitettujen lähteiden eli tekstien ja tekstikorpusten sisältöön esimerkik- 
si historialliselta tai kirjalliselta kannalta (ks. Näkökulmia filologiseen 
tutkimukseen tk.). Kirjallista aineistoa voidaan kuitenkin tutkia myös 


lingvistisesti, ja silloin liikutaan antropologisen lingvistiikan alueella. 
Mitä vanhemmasta aineistosta on kysymys, sitä suurempi merkitys ling- 
vistiikalla on aineiston ymmärtämiselle. 

On monia muinaisia kieliä, jotka tunnetaan ainoastaan kirjallisista 
lähteistä. Vain harvoja näistä kielistä — esimerkiksi etruskia — on kirjoi- 
tettu nykypäivään asti käytetyillä kirjoitusjärjestelmillä. Tyypillisempää 
on, että sekä kieli että sen kirjoitusjärjestelmä ovat jääneet pois käy- 
töstä. Tällöin lingvistin ensimmäinen tehtävä on desifroida eli tulkita 
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tuntematon kirjoitusjärjestelmä. Tällä saralla onkin saavutettu hämmäs- 
tyttäviä tuloksia: monet tärkeät muinaiset kielet — esimerkiksi muinais- 
egypti, sumeri, akkadi, heetti, arkaainen kreikka, muinaisturkki ja ki- 
taani — tunnetaan vain sen ansiosta, että niiden kirjoittamiseen käytetyt 
kirjoitusjärjestelmät on onnistuttu avaamaan. Näin saadulla aineistolla 
on poikkeuksellisen suuri arvo myös lingvistisesti, sillä se antaa kuvan 
muinaisesta kielidiversiteetistä ja sen kehityksestä aikojen kuluessa. 
Diakroniset menetelmät. Antropologisen lingvistin keräämä synk- 
roninen kenttäaineisto toimii yleisenä tietopohjana tutkittavan kielen 
tuntemukselle, ja tätä aineistoa voidaan käyttää monenlaisiin sekä tie- 
teellisiin että käytännöllisiin tarkoituksiin. Yksi merkittävä tieteellinen 
käyttöalue on diakroninen eli historiallinen kielentutkimus, jonka avulla 
lähestytään tutkittavan kielen aikaisempia vaiheita ja kehitystä. Sikäli 
kuin tukena ei ole käytettävissä filologista aineistoa, tutkimus käyttää 
niitä historiallis-vertailevan kielentutkimuksen menetelmiä (ks. His- 
toriallinen ja vertaileva kielentutkimus tk.), jotka kehitettiin Saksassa 


1800-luvun alkupuolella ja joita siellä aluksi sovellettiin indoeurooppa- 
laisten kielten tutkimukseen. Tutkimusalue on edelleen ajankohtainen, 
sillä maailmassa on useita satoja kielikuntia ja suurta osaa niistä ei vielä 
ole edes alustavasti analysoitu. 

Voi sanoa, että historiallinen ja vertaileva kielentutkimus on vain yksi 
laajasti käsitetyn antropologisen lingvistiikan osa-alueista. Siinä missä 
kenttätyö antaa kielestä synkronisen kuvan, historiallinen ja vertaileva 
tutkimus avaa ikkunan diakroniaan. Jos kielellä on sukukieliä, näiden 
keskinäisellä vertailulla voidaan rakentaa käsitys kielen ja sen sukukiel- 
ten aikaisemmista vaiheista ja rekonstruoida eritasoisia kantakieliä. Jos 
kielellä ei ole säilyneitä sukulaisia eli jos se on genealoginen isolaatti, 
sen sisältämä synkroninen informaatio — esimerkiksi morfofonologia 
— voi silti antaa mahdollisuuden diakroniseen analyysiin sisäisen re- 
konstruktion menetelmällä. Myös vertailu erisukuisiin naapurikieliin, 
joiden kanssa kieli on ollut historiallisessa kontaktissa, antaa diakronista 
tietoa kielen kehityksestä ja kronologiasta. 
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4. Antropologisen lingvistiikan teoriapohja 


Antropologinen lingvistiikka on perusluonteeltaan empiirinen tieteen- 
ala, jonka ei päämääräänsä toteuttaakseen tarvitse välttämättä mennä 
aineiston dokumentaatiota, järjestelyä ja tallentamista pitemmälle. 
Kielitieteen sisällä kulkee vanha juopa, jonka toisella puolella ovat ne 
kielitieteilijät, jotka tutkivat ”kieltä” (engl. language), ja toisella ne, jotka 
tutkivat ”kieliä” (languages). Antropologinen lingvistiikka tutkii luonnol- 
lisesti kieliä ja niiden kautta kielten moninaisuutta ja kohdistaa huo- 
mionsa erityisesti niihin piirteisiin, jotka erottavat kieliä toisistaan, eikä 
niihin, jotka universaalisti yhdistävät kaikkia kieliä. 

Mitä enemmän maailman kieliä on tutkittu, sitä ilmeisemmäksi on 
käynyt, että kielten välillä on hämmästyttävän suuria eroja. Vastaavasti 
niin sanottujen kielellisten universaalien eli kaikille kielille yhteisten 
ominaisuuksien määrä on osoittautunut hyvin pieneksi, minkä lisäksi 
yhteiset piirteet ovat tyypillisesti hyvin triviaaleja ja koskevat lähinnä 
vain kaikkein perustavimpia kielellisiä kategorioita (esimerkiksi vokaalit 
vs. konsonantit, äännesegmentit vs. sanat vs. fraasit). Toisaalta myös hy- 
vinkin keskeiset kielen osa-alueet (esimerkiksi tavurakenne, sanajärjes- 
tys, sanaluokat, muoto-oppi, lauserakenne) voivat maailman kielissä olla 
hyvin erilaisia (näitä eroja tutkii kielitypologia, ks. Kielitypologian me- 
netelmät tk.). Tämä erilaisuus merkitsee myös sitä, että ne kieliteoriat, 


jotka perustuvat vain yhden kielen — esimerkiksi englannin kielen — fak- 
toihin, eivät voi olla yleispäteviä. 

Koska kuitenkin antropologisen lingvistiikan kohteena ei ole ainoas- 
taan kieli vaan myös sen konteksti, tämän tieteenalan omat teoreettiset 
kysymyksenasettelut koskevat nimenomaan kielen ja sen kontekstin 
välistä suhdetta. Konteksti puolestaan sisältää sekä luonnonympäristön 
että kulttuurin ja sosiaaliset suhteet. Viime kädessä kontekstiin kuuluu 
myös ajattelu. 

Kielellinen relativismi. Kaikkein keskeisin teoreettinen kysymyksen- 
asettelu antropologisen lingvistiikan historiassa koskeekin kielen ja 
ajattelun suhdetta. Toisin kuin joissain kielentutkimuksen suuntauk- 
sissa, joissa lähdetään siitä, että ihmislajin ajattelu toimii universaalisti 
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samoista lähtökohdista, antropologinen lingvistiikka pitää mahdol- 
lisena sitä, että kieli vaikuttaa ajatteluun, toisin sanoen, että ihmiset 
ajattelevat eri tavoin riippuen siitä, mitä kieltä he puhuvat. Tämä niin 
sanotun kielellisen relativismin näkökulma tunnetaan myös nimellä 
Sapir-Whorf-hypoteesi (engl. Sapir-Whorf hypothesis) sitä ensimmäisinä 
kehittäneiden amerikkalaisten lingvistien Edward Sapirin (1884—1939) 
ja Benjamin Whorfin (1898-1941) mukaan (Sapir 1949; Whorf 1956). 

Kielellinen relativismi näkyy käytännössä monissa kielenkäytön yk- 
sityiskohdissa. Esimerkiksi viittausjärjestelmät, joilla kielen puhujat 
viittaavat aikaan ja paikkaan käyttäen deiktisiä sanoja (erityisesti pro- 
nomineja) tai muotoja, vaihtelevat suuresti kielestä toiseen. Puhujan, 
joka hallitsee vain oman kielensä viittausjärjestelmän, on usein vaikea 
hahmottaa toisen kielen viittausjärjestelmän sisäistä logiikkaa. Klassisen 
esimerkin saman fyysisen todellisuuden erilaisista kielisidonnaisista 
hahmotusmalleista tarjoavat myös väritermit, joiden määrä ja suhde 
värikarttaan vaihtelee. On lisäksi todettu, että värijärjestelmä täydentyy 
eri kielissä uusilla väritermeillä tietyn, lähes universaalin kaavan mu- 
kaan. Tyypillinen on esimerkiksi Itä-Aasian kielissä vallitseva viiden 
väritermin järjestelmä (valkoinen — musta — punainen - keltainen — si- 
ninen/vihreä), kuten Brent Berlin ja Paul Kay (1969) ovat klassisessa 
tutkimuksessaan osoittaneet. 

Johtopäätöksiä kielen vaikutuksesta ajatteluun ei kuitenkaan pidä vie- 
dä liian pitkälle. Joskus on esitetty, että jopa kielen perustypologia, esi- 
merkiksi sanajärjestys, voi vaikuttaa yksilön ja yhteisön käyttäytymiseen 
tai vaikkapa onnettomuusalttiuteen eri tilanteissa. Näin ei varmaankaan 
ole. Yhtä epätodennäköistä on, että jos kielessä ei ole tempusjärjestel- 
mää, sen puhujilta puuttuisi käsitys ajasta. Kysymys on enemmänkin 
siitä, että eri kielet ilmaisevat eri asioita eri tavoin, ja asiat, jotka yhdessä 
kielessä ilmaistaan kieliopin keinoin, voidaan toisessa kielessä ilmaista 
sanaston avulla tai jättää kokonaan ilmaisematta. Se, mitä kategorioita 
kieli ilmaisee, ei välttämättä korreloi sen kanssa, kuinka kielen puhujat 
hahmottavat todellisuuden. 

Ympäristön heijastuminen kieleen. Vaikka on siis epätoden- 
näköistä, että kieli suoranaisesti vaikuttaisi ajatteluun, on selvää, 
että ympäristö vaikuttaa kieleen, ja tämän vaikutuksen analysointi 
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kuuluu antropologisen lingvistiikan keskeisiin teoreettisiin teemoihin. 
Jo Ferdinand de Saussure (18571913), jota tosin ei varsinaisesti voi pi- 
tää antropologisen lingvistiikan edustajana, esitti, että ”kansakunnan 
tavat heijastuvat sen kieleen ja kieli muokkaa kansakuntaa” (de Saussure 
2014). Yksiselitteisin yhteys vallitsee ympäristön ja sanaston välillä: jo- 
kaisessa kielessä on runsaasti erikoistunutta sanastoa, joka vastaa sen 
puhujien luonnonympäristöä ja kulttuuri-identiteettiä. Tunnettua on, 
että esimerkiksi eskimokielissä on monipuolinen lumisanasto. Metsäs- 
tykseen tai kalastukseen erikoistuneilla kieliyhteisöillä on vastaavasti näi- 
hin elinkeinoihin liittyvää erikoissanastoa, jota on mahdotonta kääntää 
suoraan muunlaista elintapaa edustavien väestöjen puhumille kielille. 

Sanaston sisällä erottuu myös suljettuja järjestelmiä, jotka ovat eri- 
tyisen kulttuurisidonnaisia. Paljon tutkittu antropologien ja siis myös 
lingvistien kohde on sukulaisuussanasto (engl. kinship terminology), joka 
heijastaa kieliyhteisön sosiaalisia suhteita (Morgan 1871). Sosiaaliset erot 
ja hierarkiat voivat näkyä myös siinä, miten sanoja käytetään ja miten eri 
yhteisön jäseniä ja ryhmiä puhutellaan missäkin tilanteessa: esimerkiksi 
antamista ja saamista tarkoittavat sanat voivat vaihdella sen mukaan, 
mitkä antajan ja saajan sosiaaliset suhteet ovat. Monissa yhteisöissä on 
myös eroja naisten ja miesten kielten välillä. Sosiaalisia suhteita osoite- 
taan kielellisin keinon muun muassa monissa Itä-Aasian kielissä (esi- 
merkiksi japanissa ja koreassa). Eroja naisten ja miesten kielessä on 
niin ikään joissakin Itä- ja Pohjois-Aasian kielissä (esimerkiksi japanissa 
ja tshuktshissa). 

Lingvistisesti erityisen mielenkiintoisia ympäristön kielivaikutukset 
ovat silloin, kun niillä on yhteys kielen rakenteeseen. Sosiaaliset suh- 
teet voivat ilmetä sanaston lisäksi myös kieliopissa erilaisina kohteliai- 
suustasoina, joilla voi olla esimerkiksi morfologinen ilmiasu (Brown & 
Levinson 1987). Tavallista on myös, että kielissä on genus- ja luokka- 
järjestelmiä, joiden avulla sanasto luokitellaan fyysisen sukupuolen 
tai muun ulkoisen ominaisuuden mukaan luokkiin. Luokilla voi olla 
morfologiset indikaattorit, ja ne voivat kongruenssin kautta ilmetä myös 
syntaksissa. Lisäksi eri luokkiin viittaaminen saattaa tapahtua erityisen 
klassifikaattorijärjestelmän avulla, ja myös deiktiset sanat, kuten prono- 
minit, korreloivat yleensä luokkien kanssa (Aikhenvald & Mihas 2019). 
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Paljon kiistelty kysymys on, voiko myös luonnonympäristö vaikuttaa 
kielen rakenteeseen. On esitetty, että esimerkiksi kylmässä ilmanalassa 
puhuttujen kielten äännejärjestelmät välttävät huuliäänteitä (labiaaleja), 
kuten näyttää olevan tilanne eskimo- ja aleuttikielissä. On myös ehdo- 
tettu, että agglutinatiivinen kielityyppi olisi erityisen tavallinen nomadi- 
kansojen kielissä, jolloin se korreloisi näiden kansojen tyypillisesti 
aukeiden luonnonympäristöjen sekä kieliyhteisöjen laajojen nautinta- 
alueiden kanssa. Toistaiseksi evidenssi tällaisten korrelaatioiden puo- 
lesta näyttää olevan heikkoa. 

Kieli ja etnos ajassa ja paikassa. Kieli on laajalti hyväksytyn näke- 
myksen mukaan tärkein etnisyyden tunnusmerkki. Diakronisen kielen- 
tutkimuksen menetelmät antavat mahdollisuuden seurata kieltä par- 
haassa tapauksessa useita tuhansia vuosia ajassa taaksepäin. Etnisyyttä 
määrittävät kuitenkin myös kieliyhteisön kulttuuriset piirteet ja biologi- 
nen perimä. On hyvä ymmärtää, että kieli, kulttuuri ja biologiset omi- 
naisuudet eivät välttämättä periydy samassa linjassa vaan enimmäkseen 
toisistaan riippumatta. Tästä syystä kieliyhteisön etnistä identiteettiä ei 
voida seurata taaksepäin yhtenäisenä kokonaisuutena, vaan kielellä, 
kulttuurilla ja biologisilla ominaisuuksilla on kullakin oma taustansa. Li- 
säksi vain kielen taustaa voidaan seurata yhtenäisenä linjana, jonka mää- 
rittää sen polveutuminen aikaisemmista kielimuodoista ja kantakielistä. 

Välittömästi historiallis-vertailevan kielentutkimuksen synnyttyä 
heräsi myös pyrkimys yhdistää kielten ja kielikuntien varhaisvaiheita 
konkreettisiin aikoihin ja paikkoihin sekä myös muinaisiin väestöihin. 
Tämä kysymyksenasettelu on edelleen relevantti, ja sitä voidaan pitää 
antropologisen lingvistiikan tärkeimpänä diakronisena teemana. Paitsi 
yksittäisten kielten ja kielikuntien historiaa tutkimus pyrkii selvittämään 
myös kokonaisten maantieteellisten alueiden kielellistä taustaa. Vaikka 
kaikilla kielillä on puhuma-alueensa, nämä alueet ovat yleensä sekun- 
daareja ja niiden takana on monimutkainen verkosto kielten liikkeitä 
ajassa ja paikassa. Kielialueet ovat historian ja esihistorian kuluessa voi- 
neet kasvaa (ekspansio), supistua (kontraktio) tai siirtyä (translokaatio), 
ja kielihistoriallinen tutkimus voi antaa tietoa näistä muutoksista. 

Keskeinen ja myös suurta yleisöä kiinnostava kysymys kaikkien kieli- 
kuntien kohdalla koskee alkukotia (sa. Urheimat) eli sitä muinaista 
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kontekstia, josta kielikunta on lähtöisin. Tätä kysymystä lähestytään 
usein kielikunnan sisäisen rakenteen pohjalta, jolloin oletetaan, että 
kielikunta on syntynyt siellä, missä se ensimmäisen kerran jakau- 
tui eli missä sen syvimmät sisäiset erot sijaitsevat. Apua antaa myös 
paleolingvistiikkana tunnettu tutkimusala, joka erityisesti kantakielen 
kulttuuri- ja luontosanastoa analysoimalla tekee johtopäätöksiä sitä 
vastanneen muinaisen kieliyhteisön kulttuurista ja luonnonympäris- 
töstä. Lisäaineistoa saadaan kielikontaktien ja kielellisten substraattien 
tutkimuksella, joka paljastaa kielten muinaisia liikkeitä sekä nykyisten 
kielten alueilla aikaisemmin puhuttujen kielten jälkiä. 

Parhaassa tapauksessa kielen varhaisvaiheet voidaan sitoa absoluut- 
tisesti ajoitettaviin arkeologisiin konteksteihin, mutta yleensä kielen ja 
arkeologian suhde on diffuusi eikä suoria rinnastuksia voida välttämät- 
tä koskaan tehdä. Kantakielten ajoituksesta antaakin parhaan osviitan 
rekonstruoitavan sanaston määrä ja luonne. Mitä vähemmän yhteis- 
tä sanastoa on, sitä kauempana ajassa kantakieli todennäköisesti on. 
Ongelmana on kuitenkin se, että sanasto uudistuu vaihtelevalla nopeu- 
della, eikä tämän vaihtelun yleisiä lainalaisuuksia vielä täysin ymmärretä. 


5. Antropologisen lingvistiikan sovellukset 


Antropologisella lingvistiikalla on monia käytännön sovelluksia, jotka 
liittyvät erityisesti kielten globaalin uhanalaisuuden ilmiöön. Vaikka kie- 
liä on aina sammunut, maailman kielidiversiteetti ei ole koskaan ollut 
niin uhattu kuin nykyään. Arviot ilmiön laajuudesta vaihtelevat, mutta 
varovaistenkin ennustusten mukaan yli puolet ja pessimistisemmän nä- 
kemyksen mukaan (Krauss 1992) jopa 90 prosenttia maailmassa vielä 
tällä hetkellä puhutuista kielistä sammuu kuluvan vuosisadan aikana. 
Tähän uhkaan kielitiede on havahtunut vasta 1980-luvulta alkaen. Tyy- 
pillistä on, että suuri yleisö ja poliittiset päättäjät suhtautuvat kielten 
katoon edelleen välinpitämättömästi, samalla kun luonnondiversitee- 
tin katoaminen on jo tiedostettu ongelmaksi — siitä huolimatta, että se 
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koskee vain muutamaa prosenttia elävän luonnon moninaisuudesta. 
Tilanne on siis hälyttävä ja vaatii nopeita toimia antropologisen ling- 
vistiikan harjoittajilta. Katoavia kieliä on tutkittava, mutta myös niitä pu- 
huvia kieliyhteisöjä on tuettava, ainakin silloin kun yhteisöt itse kokevat 
kielensä katoamisen ongelmaksi. Ilmiöllä on vahva poliittinen ulottu- 
vuus, sillä ilman valtakoneistojen tukea kielten katoamista on mahdo- 
ton pysäyttää. Ongelmana on kuitenkin se, että valtakoneistot - muun 
muassa kansallisvaltiot ja niiden yhteistyöjärjestöt — ovat perinteisesti 
juuri ne tahot, jotka ovat edesauttaneet kielten katoamista. 
Uhanalaisuuden tiedostaminen. Ensimmäinen askel kielten katoa- 
misen hillitsemiseksi on ilmiön kartoittaminen ja tietoisuuden levittä- 
minen sen seurauksista. 1990-luvulta alkaen onkin luotu järjestelmiä 
ja julkaisukanavia, joihin tietoja uhanalaisista kielistä on voitu syöttää 
ja joista suuri yleisö voi saada niistä tietoa. Tärkein globaali yritys tällä 
alalla on ollut Unescon julkaisema uhanalaisten kielten kartasto Atlas of 
the World's Languages in Danger, josta on ilmestynyt sekä painettuja että 
verkkoversioita. Tämän hankkeen rinnalle on tullut aluksi Googlen tuella 
toteutettu uhanalaisten kielten luettelo (Endangered Languages Catalogue 
eli ElCat), joka pyrkii toimimaan interaktiivisena verkkosivustona. 
Yksittäisten kielten uhanalaisuuden astetta on yritetty arvioida monel- 
la eri järjestelmällä, joista yksi on The Ethnologue -tietokannan käyttämä 
EGIDS (Expanded Graded Intergenerational Disruption Scale). Karkeasti 
maailman kielet voidaan jakaa elinvoimaisiin (engl. viable), uhanalai- 
siin (engl. endangered), katoaviin (engl. moribund) ja kuolleisiin (engl. 
extinct), mutta uhanalaisten kielten tila vaihtelee paljon riippuen muun 
muassa kieliyhteisön absoluuttisesta koosta, ikärakenteesta, stabiliteetis- 
ta, liikkuvuudesta, kaksikielisyydestä ja virallisesta statuksesta. Yleensä 
kielten katoamisen takana on kieliyhteisön syrjäytyminen kielten välises- 
sä kilpailussa. On kuitenkin myös entisiä valtakieliä, jotka ovat menettä- 
neet elinvoimansa, kuten Irlannin virallinen kieli iiri. 
Usein kysytään, onko uhanalaisten kielten säilyttäminen tarpeellis- 
ta ja miksi. Vastaus on sama kuin luonnon moninaisuuden osalta: di- 
versiteetti on itseisarvo, joka voi osoittautua ennakoimattomalla tavalla 
hyödylliseksi. Joka tapauksessa on varmaa, että niin sanottujen luonnon- 
kansojen kulttuurit sisältävät kieleen sidottua tietoa esimerkiksi kasvi- ja 
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eläinlajeista, joilla on muun muassa lääketieteellistä käyttöä. Kun kieli 
katoaa, katoaa myös sen kannattama kulttuuri ja toisin päin, joten uhan- 
alaisten kielten suojelu merkitsee myös kulttuuridiversiteetin suojelua. 

Uhanalaisten kielten dokumentointi. Vähin, minkä antropologinen 
lingvistiikka voi kielellisen diversiteetin säilyttämiseksi tehdä, on doku- 
mentoida katoavat kielet mahdollisimman kattavasti. On usein esitetty, 
että lingvistin — eikä vain antropologisen lingvistin — koulutukseen tulisi 
aina sisältyä kenttätyöhön perustuva aikaisemmin tutkimattoman kielen 
dokumentoiminen. Näin esimerkiksi lingvistisen väitöskirjatyön koh- 
teeksi tulisi aina valita jonkin uhanalaisen kielen kartoitus. Tämän het- 
ken tilanne on pahaenteinen, sillä kieliä katoaa nopeammin kuin niitä 
ehditään tutkia. Yhtenä syynä on toisen maailmansodan jälkeen alkanut 
yleisen kielitieteen yksipuolistuminen, joka on vienyt tutkimuksen pois 
kielidiversiteetistä kohti aivan muita kysymyksenasetteluja. Tilanne on 
tosin aivan viime aikoina alkanut tältä osin kehittyä parempaan suun- 
taan. Suomessakin on tehty jo useita väitöskirjoja, joiden kohteena on 
ollut aikaisemmin dokumentoimaton uhanalainen kieli. 

Uhanalaisten kielten kartoitus on mahdollista vain pitkäjänteisen ja 
systemaattisen kenttätyön avulla, ja kartoituksen tulee tapahtua — kuten 
aina antropologisessa lingvistiikassa — mahdollisimman yksinkertaisella 
ja teorioista riippumattomalla tavalla. Näin saatu aineisto palvelee hyvin 
myös esimerkiksi historiallis-vertailevan kielentutkimuksen ja kielitypo- 
logian tarpeita. Ihannetapauksessa uhanalaisen kieliyhteisön kokonais- 
valtaiseen tutkimukseen osallistuu tutkijoita myös muilta tieteenaloilta, 
kuten fyysisestä antropologiasta, folkloristiikasta, uskontotieteestä, his- 
toriasta, arkeologiasta ja etnobotaniikasta. Maailmassa on vain harvoja 
kieliyhteisöjä, jotka on riittävän monipuolisesti kartoitettu. 

Kielten revitalisointi. Antropologinen lingvistiikka voi myös konkreet- 
tisesti auttaa kieliyhteisöjä ylläpitämään ja elvyttämään kieliään. Kielten 
elvytys eli revitalisaatio on varsinaisesti vasta 1990-luvulta alkaen nous- 
sut yhdeksi kielitieteen sovellusalueeksi (Hinton, Huss & Roche 2018). 
Kielen kato tapahtuu yleensä käyttöyhteyksien eli domeenien menetyk- 
sen kautta. Kielen elvytys tulee ajankohtaiseksi viimeistään silloin, kun 
kielen jatkuvuus yhteisössä on katkennut eli kun on ehtinyt kasvaa yksi 
sukupolvi, joka ei enää hallitse yhteisön omaa alkuperäistä kieltä. Koska 


LUKU 16 ANTROPOLOGINEN LINGVISTIIKKA 743 


varsinkin pienten niin sanottujen alkuperäiskansojen kielten käyttö- 
yhteydet ovat hyvin kulttuurisidonnaisia, kielen elvytys vaatii usein myös 
kulttuurin elvytystä tai ainakin suojelua. 

Onnistuneita kielenelvytysprojekteja on maailmassa toistaiseksi vain 
muutamia: näitä myönteisiä esimerkkejä ovat Uuden-Seelannin maori, 
Havaijin saarten havaiji sekä Suomen Lapin inarinsaame, joille kaikille 
on rakennettu uusi puhujasukupolvi. Inarinsaamen elvytystyötä on kä- 
sitellyt väitöskirjassaan Annika Pasanen (2015). Päämenetelminä tässä 
työssä on käytetty toisaalta niin sanottuja opettaja-oppilasryhmiä (engl. 
master-apprentice), toisaalta kielipesiä (engl. language nest). Opettaja- 
oppilasryhmissä vanhemman, kieltä hyvin taitavan sukupolven edustajat 
kehittävät vapaan keskustelun avulla nuoremman, kieltä heikommin 
taitavan sukupolven kielitaitoa. Kielipesissä taas kieltä täysin taitamaton 
nuorin sukupolvi osallistuu päiväkotimuotoiseen kielikylpyyn, jossa käy- 
tetään yksinomaan elvytettävää kieltä. 

Kielenelvytys on mahdollista ainoastaan, jos yhteisöllä on riittävä mo- 
tivaatio kielen palauttamiseen. Usein riittää, että yhteisössä on muuta- 
ma aktiivinen yksilö, joiden johdolla projekti voi alkaa. Yleensä tarvitaan 
kuitenkin myös julkista tukea, sekä rahallista (esimerkiksi kielipesien 
toiminnan aloittamiseen) että moraalista. Julkisella tuella valtayhteisö, 
jonka käsissä myös valtakoneistot ovat, voi osoittaa arvostavansa elvytet- 
tävää kieltä. Kokemus osoittaa, että kielen elvytys voi toimia ensiaske- 
leena myös kulttuurin elvytykselle. Yhteisön omanarvontunto kohoaa 
oman kielen taidon kasvaessa, mikä vähentää sosiaalista syrjäytymistä 
ja saattaa viime kädessä olla valtayhteisölle taloudellisestikin edullista. 

Kirjakielten luominen. Usein kielenelvytysprojekteihin liittyy myös 
kielen kirjoitetun käytön edistäminen. Useimmat maailman uhanalai- 
sista kielistä ovat vailla kirjoitusperinnettä, mikä tarkoittaa sitä, että nii- 
den puhujat käyttävät kirja- ja sivistyskielinään muita kieliä. Kirjoitetun 
kielen periaatteiden luominen sopii hyvin lingvistisen antropologian 
kohteeksi, sillä se edellyttää tutkittavan kielen äännejärjestelmän ana- 
lyysiä ja sen suhteuttamista käytettävissä oleviin kirjoitusjärjestelmiin, 
jotka eivät suinkaan aina rajoitu latinalaiseen kirjaimistoon. Tulokse- 
na on parhaassa tapauksessa uuden, kirjallisen domeenin syntyminen 
uhanalaiselle kielelle. 
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Olisi kuitenkin virhe kuvitella, että kirjoitetun kielen luominen sinän- 
sä voisi pelastaa kielen katoamiselta. Erityisen tarpeetonta ja jopa vaaral- 
lista on luoda sisäisesti aina varioivalle ja aikaisemmin vain puhuttuna 
käytetylle kielelle yhtenäinen normatiivinen kirjakieli. Sen sijaan että 
puhujat kokisivat kirjakielen uudeksi domeeniksi, he saattavat nähdä sen 
omalle puheelleen vieraana ja keinotekoisena rakennelmana. Parempi 
onkin, jos kielelle luodaan ainoastaan löyhät oikeinkirjoituksen peri- 
aatteet, joita voi tarvittaessa soveltaa esimerkiksi sähköisessä kommuni- 
koinnissa. Kirjallisen kulttuurin luominen hyvin pienen yhteisön kielelle 
on käytännössä epätarkoituksenmukaista ja resursseja haaskaavaa. 

Fettiset kysymykset. Kielten elvyttäminen ja kirjoitusjärjestelmien 
luominen voidaan selkeästi nähdä antropologisen lingvistiikan ”lah- 
joina” tutkittavia kieliä puhuville yhteisöille. Yleensä yhteisöt ottavat 
nämä lahjat myönteisesti vastaan, ja ne voidaankin nähdä luonnollisina 
vastapalveluksina yhteisöille, jotka toimivat tutkimuksen kohteina. On 
kuitenkin vaikeampi ottaa kantaa siihen, onko myös pelkkä kielten do- 
kumentoiminen lahja puhujayhteisdille. Useinhan kielen dokumentoi- 
minen on tutkijalle meritoivaa toimintaa, jonka kautta voi aueta esimer- 
kiksi tieteellinen ura. Puhujille tutkijan apuna toimiminen voi kuitenkin 
merkitä vain ylimääräistä vaivaa, josta heille ei välttämättä koidu mitään 
välitöntä korvausta. 

Varsinkin pohjoisamerikkalaisen poliittisen korrektiuden diskurssis- 
sa on pienten etnisten ryhmien keskuuteen levitetty ajatusta, että kieli, 
kuten myös sitä puhuvan yhteisön kulttuuri ja geeniperimä, ovat yhtei- 
sön omaisuutta, jota ei tule luovuttaa ulkopuoliseen tutkimuskäyttöön. 
Tällainen asenne on tutkimukselle haitallinen ja tekee antropologisen 
lingvistiikan harjoittamisen, kuten muunkin antropologisen tutkimuk- 
sen, hankalaksi ja poliittisesti arkaluontoiseksi. On kuitenkin muistetta- 
va, että kieli on immateriaalinen ominaisuus, jota ei sellaisenaan voida 
ottaa pois kieliyhteisöltä, vaikka se dokumentoitaisiin — päinvastoin kie- 
len dokumentoiminen voi auttaa yhteisöä säilyttämään kielensä. Kaikki 
kielet ovat ihmiskunnan yhteistä omaisuutta, eikä kieliyhteisöillä ole 
yksinoikeutta omiin kieliinsä. 

On silti hyvä miettiä, miten kielenoppaiden työ on parhaiten korvatta- 
vissa, sillä kielen akateeminen tutkimus ei välttämättä riitä korvaukseksi 
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heidän vaivannäöstään. Parhaassa tapauksessa tutkija tulee siinä määrin 
tutkimansa kieliyhteisön jäseneksi, että kysymys ei aktuaalistu, mutta 
usein tutkijan on korrektia huolehtia siitä, että kielenoppaat saavat myös 
aineellisen korvauksen. Tämä on aina syytä ottaa huomioon dokumen- 
taatioprojektien budjettia suunniteltaessa (kielten dokumentaatioon liit- 
tyvistä eettisistä ja käytännöllisistä ongelmista ks. Kielten dokumentointi 
ja kieliopin kuvaus tk.). 


6. Yhteenveto: antropologisen lingvistiikan 
toimijoita 


Vaikka alalla on pitkät perinteet, lingvistinen antropologia on organisoi- 
tuna kansainvälisenä tieteenalana varsin nuori. Alan modernit oppi- ja 
käsikirjat ovat enimmäkseen englanninkielisiä, tärkeimpinä William 
Foleyn Anthropological Linguistics (1997) ja Alessandro Durantin 
Linguistic Anthropology (1997). Esimerkki alan viimeaikaisista sovelluk- 
sista etnolingvistiikan nimellä on James W. Underhillin Ethnolinguistic 
and Cultural Concepts (2012). Uhanalaisia kieliä käsittelevät esimerkiksi 
teokset Austin & Sallabank (2012) ja Rehg & Campbell (2018). 

Alan tunnetuin yhdysjärjestö on pohjoisamerikkalainen lingvistisen 
antropologian seura, Society for Linguistic Anthropology (SAL), joka 
kuuluu osana Amerikan antropologiseen liittoon, American Anthropo- 
logical Association. Seura on vuodesta 1959 alkaen julkaissut alan aika- 
kauslehteä nimeltä Anthropological Linguistics. Toinen merkittävä toimija 
on niin ikään pohjoisamerikkalainen kielen esihistorian tutkimuksen 
seura, Association for the Study of Language in Prehistory (ASLIP), 
joka vuodesta 1995 alkaen on julkaissut aikakauslehteä Mother Tongue. 
Kenttätyöperinteen kehittäjänä on muistettava myös Summer Institute 
of Linguistics (SIL), joka järjestää säännöllisesti kielitieteen koulutusta 
protestanttista lähetystyötä tekeville lingvisteille sekä julkaisee kenttä- 
työhön perustuvia tutkimustuloksia muun muassa sivustolla nimeltä 
SIL Forum for Language Fieldwork. 
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Alan suomalaista perinnettä edustava Suomalais-Ugrilainen Seura 
on perustamisestaan (1883) lähtien julkaissut kielitieteellisen kenttätyön 
tuloksia. Seuran aikakauskirjassa Journal de la Societe Finno-Ougrienne ja 
sen rinnalla ilmestyvissä ”Toimituksissa”, Memoires de la Societe Finno- 
Ougrienne, on jo 135 vuoden ajan ilmestynyt lukuisien euraasialaisten 
kielten kieliopillisia ja kielihistoriallisia kuvauksia, joita täydentävät 
seuran julkaisemat tieteelliset sanakirjat. Seura on myös merkittävällä 
tavalla osallistunut kielten uhanalaisuutta koskevaan keskusteluun jo 
paljon ennen kuin aihe nousi kansainvälisen lingvistiikan kohteeksi. 
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Mika? 


Kieliopin tutkimus on kielen rakenteen kuvausta. Kuten muukin tieteelli- 
nen tutkimus kieliopin tutkimus perustuu järjestelmälliseen havainnoin- 
tiin ja johdonmukaiseen päättelyyn. Tutkimuksen tavoitteena on kuvata 
yksittäisten kielten järjestelmiä sekä kielten välisiä yhtäläisyyksiä ja eroja. 
Kieliopin tutkimus on kielentutkimuksen vanhimpia osa-alueita, ja koulu- 


kuntaeroja ja eri traditioita on useita. 

Katso myös: 

Luku 1 Kielitaju kielentutkijan työkaluna 

Luku 13 Kielten dokumentointi ja kieliopin kuvaus 
Luku 14 Kielitypologian menetelmät 

Luku 15 Historiallinen ja vertaileva kielentutkimus 


Luku 16 Antropologinen lingvistiikka 
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1. Johdanto 


Sanalla kielioppi voidaan viitata erilaisiin ilmidihin. Aidinkielen kielioppi 
on jokaisen kielenkäyttäjän sisäinen tieto siitä, miten kieli rakentuu, 
millaiset rakenteet noudattavat kielenkäyttäjän oman kieliyhteisön kie- 
lellisiä normeja (ks. Kielitaju kielentutkijan työkaluna tässä kirjassa). 


Tämä tieto käsittää esimerkiksi (implisiittisesti) sisäistetyt säännöt siitä, 
miten äidinkielen äänteet vaihtelevat tai sanat taipuvat. Kielenpuhujan 
sisäinen kielioppi eroaa kuitenkin laajemmasta käsitteestä kielitieto, joka 
kattaa kielen rakenteen lisäksi esimerkiksi puhujan mahdolliset tiedot 
kielen (ja kielten) historiasta, kehityksestä, variaatiosta, kielen yhteyk- 
sistä kulttuuriin ja käyttötilanteisiin jne. (Ks. esim. Kalliokoski, Kume- 
nius, Luukka, Mustaparta, Nissilä & Tuomi 2015.)' Voikin sanoa, että 
kielitiedon ja sisäisen kieliopin avulla kielenpuhuja oppii kielitietoisuutta 
— kielen ilmiöiden ja niiden yhteyksien liittymistä käytäntöön (ks. Haku- 
linen, Kauppinen, Leiwo, Paunonen, Räikkälä, Saukkonen, Yli-Vakkuri, 
Östman & Alho 1996). 

Kielioppia kuvattaessa kieltä lähestytään järjestelmänä. Termillä kieli- 
oppi voidaankin viitata myös kieliopin kuvaukseen. Kirjoitetut kieliopit 
palvelevat erilaisia tarkoituksia. Kieliopin päämäärä voi olla ohjeiden an- 
tamista hyväksyttävästä ja oikeanlaisesta kielestä. Tällainen lähestymis- 
tapa luonnehtii esimerkiksi kielenhuollon ja -opetuksen tarpeisiin laa- 
dittuja kielen rakenteen kuvauksia. Näitä yleensä kirjakielen sääntöjä 
kuvaavia kielioppeja kutsutaan preskriptiivisiksi. Kielentutkijan näkö- 
kulmasta kielioppi on yleisemmin ihmiskielen ilmausten rakentumis- 
periaatteita kuvaava järjestelmä, jota voidaan lähestyä hyvin erilaisista 
tarkastelukulmista sekä erilaisin työkaluin ottamatta kantaa siihen, onko 
kuvattava kielen ilmiö suositeltavaa tai luvallista. Tällaiset vakiintuneet 
puhutun ja kirjoitetun kielen käytänteitä kuvaavat kieliopit ovat deskrip- 
tiivisiä. Myös deskriptiivinen kielioppi kuvaa normeja, koska kieli on 
luonteeltaan normatiivinen järjestelmä, joka toimii ihmisten välisen 
viestinnän välineenä (Itkonen 1978). Tieteellisen kielentutkimuksen 
alaan kuuluu laaja kirjo erilaisia kielioppeja tai suuntauksia: struktu- 
raalinen, generatiivinen, kognitiivinen, systeemis-funktionaalinen, 
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konstruktio-, dependenssi- ja sijakielioppi, typologien käyttämä perus- 
kielioppi jne. Tässä artikkelissa keskitymme kielioppiin kielen kuvauk- 
sen kannalta ja deskriptiivisestä näkökulmasta. 

Kielioppi tarkoittaa lyhyesti sanottuna kielen rakenteen kuvausta. 
Kieliopin kirjoittaminen perustuu ajatukseen, että kielessä on paljon 
sellaista säännönmukaisuutta, joka voidaan kuvata yleisellä tasolla sa- 
maan tapaan kuin vaikkapa luonnontieteiden kaavat (e = mc?) tai lait 
(esim. Suomen perustuslain 9 § lause Suomen kansalaisella ja maassa 
laillisesti oleskelevalla ulkomaalaisella on vapaus liikkua maassa ja valita 
asuinpaikkansa. = "Jokaiselle Suomen kansalaiselle tai maassa laillisesti 
oleskelevalle ulkomaalaiselle pätee, että hänellä on vapaus liikkua maas- 
sa ja valita asuinpaikkansa”). Samaa säännönmukaisuutta voidaan so- 
veltaa erityistapauksiin. Aikaisemmin kuvaamatonta kieltä lähestyessä 
onkin tapana kirjoittaa toisaalta sanakirja ja toisaalta kielioppi. Luonnol- 
lisen kielen kieliopin kuvauksen pohjana on dokumentointi. Christian 
Lehmann määrittelee kielen dokumentoinnin representatiivisen aineis- 
ton kokoamiseksi, esittämiseksi ja työstämiseksi. Representatiivinen tar- 
koittaa tässä yhteydessä aineistoa, joka antaa selkeän ja riittävän kuvan 
siitä, miten ja mihin tarkoituksiin kielen rakennetta käytetään, ja joka 
on myös muiden tutkijoiden ulottuvilla. Kielen kuvauksen tarkoitus 
on määritellä tämän aineiston pohjalta säännöt, joiden mukaan kieli 
toimii. (Lehmann 2001, 83; aiheesta lisää ks. Kielten dokumentointi 
ja kieliopin kuvaus tk.) Joka tapauksessa kielen kuvaaminen kieliopik- 


si edellyttää, että kielen rakenteeseen sisältyy olennaisesti säännön- 
mukaisuutta. Muussa tapauksessa dokumentointi kannattaisi tehdä 
muulla tavoin kuin kielioppisäännöillä, kuten tyytymällä luokitteluihin 
ja kategorioiden luonnehtimiseen. 

Kielioppiin kuuluvat yleisen käsityksen mukaan äänneoppi (fono- 
logia), muoto-oppi (morfologia) ja lauseoppi (syntaksi) sekä näiden kes- 
kinäinen vuorovaikutus. Rajat kieliopin eri osa-alueiden välillä eivät ole 
tarkkoja tai itsestään selviä. Joissain kieliopin kuvauksissa esimerkik- 
si morfologiaa ja syntaksia käsitellään yhtenä kielijärjestelmän osana. 
Kieliopilla voidaan erikseen tarkoittaa vain kielen säännönmukaisuuk- 
sia. Yksi tällainen kaikille tuttu kieliopillinen säännönmukaisuus on 
suomen kielessä, niin yleiskielessä kuin murteissakin, esimerkiksi se, 
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että adjektiiviattribuutti kongruoi pääsanansa kanssa sijassa ja luvussa 
(isolla talolla : isoilla taloilla : isossa talossa : isoissa taloissa). Kongruenssi 
toteutuu riippumatta siitä, mikä substantiivi ja mikä adjektiivi kulloin- 
kin on kyseessä. Toinen tuttu esimerkki on vaikkapa se, että ensitavua 
kauempana yhdistelmän CV (C on jokin konsonantti, V on jokin vokaa- 
li) edellä on aina tavunraja (ka.la = CV.CV, kal.la = CVC.CV, kars.ki = 
CVCC.CV, kar.me.a = CVC.CV V, lii.ma = CVV.CV). 

Käsittelemme ensin lyhyesti kieliopin kirjoituksen historiaa sekä 
yleisesti että suomen kielen kuvauksen kannalta. Sen jälkeen tarkas- 
telemme kieliopin tutkimuksen keskeisiä osa-alueita, joitain eri kieli- 
oppitraditioiden keskinäisiä eroja sekä kieliopin soveltamista. 


2. Kieliopin kirjoituksen historiaa ja taustaa 


Kieliopin kirjoitus on historian kuluessa aina ollut kytköksissä yleiseen 
yhteiskunnalliseen kehitykseen ja vallitseviin tieteellisiin ajatusmallei- 
hin. Vanhin tunnettu kielioppi on sanskritin kielioppi (noin 400 eKr.), 
mutta jo sumerilaisten tiedetään analysoineen kieltä (ks. Itkonen 1991; 
Rasinkangas 2018, 18). Kielioppeja laadittiin myös antiikin Kreikassa. 
Antiikin aikoina kielitiedettä ei harjoitettu omana tieteenalanaan, eikä 
silloin ollut vielä kieliopin tutkimusta samassa mielessä kuin se nykyisin 
ymmärretään. Nykyinen kielenkuvaus kuuluu kuitenkin niihin kielen- 
tutkimuksen osa-alueisiin, jotka ovat vahvimmin kytköksissä antiikin 
perinteeseen (ks. Viljamaa 2007). Jo Sokrates (470-399 eKr.), Platon 
(427-347 eKr.) ja Aristoteles (384—322 eKr.) pohtivat kielen olemusta ja 
alkuperää. Monet vanhasta Kreikasta periytyneistä kieltä koskevista ky- 
symyksenasetteluista ovat jatkuvasti ajankohtaisia, kuten kysymys siitä, 
onko kieli katsottava luonnonlakien määräämäksi ilmiöksi (physis) vai 
sosiaaliseksi konventioksi (nomos), tai millainen on kielellisen merkin 
ja todellisuuden suhde. Platon käsittelee viimeistä kysymystä etymo- 
logioiden kautta kielifilosofisessa dialogissaan Kratylos, jossa hän pohtii, 
voiko äänneyhdistelmän määritellä jonkin merkityksen luonnolliseksi 
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vastineeksi. Aristoteles (1994) puolestaan käyttää ominaisuuksia ja re- 
laatioita käsittelevässä logiikassaan termejä, joita ilman nykyinen lau- 
seenjäsennys ei tule toimeen (predikaatti, subjekti, objekti), vaikka niitä 
alun perin ei ollut tarkoitettu varsinaisesti kielen kuvaukseen. 

Ensimmäisessä kreikan kieliopissa noin vuodelta 100 eKr, Tekhne 
grammatikessa, Dionysios Traakialainen erottaa kahdeksan sanaluok- 
kaa: substantiivit, verbit, partisiipit, artikkelit, pronominit, prepositiot, 
adverbit sekä konjunktiot; verbien kuvauksesta löytyy jo pääluokka, tapa- 
luokka (modus), persoona, luku, aikamuoto (tempus) ja konjugaatio. 
Suurin ero nykyaikaisiin kieliopin esityksiin on siinä, että lauseraken- 
teen analyysi puuttuu kokonaan — se ilmaantui pari vuosisataa myö- 
hemmin Apollonius Dyscoluksen kieliopissa, jossa käsitellään verbien, 
pronominien ja prepositioiden käyttäytymistä sanojen yhdistelmissä 
(esimerkiksi kongruenssia). Ainut meille antiikista periytynyt latinan 
lauseopin kuvaus on Priscianuksen vuonna 527 kirjoittama Institutiones 
grammaticae, jossa käsitellään riippuvuus- eli dependenssisuhteita, ku- 
ten rektiota eli pääsanan suhdetta täydennykseen. Toinen merkittävä 
myöhäisantiikin grammaatikko oli Aelius Donatus, jonka Ars minor 
(kysymys-vastausmuotoinen sanaluokkien käsittely) ja Ars maior (pe- 
rusteellinen latinan kielen kuvaus, joka sisälsi myös tyyliohjeet) vai- 
kuttivat eurooppalaisiin kielioppikirjoituksiin 400-luvulta 1200-luvulle 
asti. (Ks. esim. Encyclopedia of Linguistics; Oxford Handbook of History of 
Linguistics; Householder 1981.) 

Myöhäisantiikin latinan kieliopit voidaan sisältönsä ja rakenteensa 
perusteella luokitella neljään ryhmään, luonteeltaan joko pedagogi- 
sempiin tai teoreettisempiin: koulukieliopit, sääntökieliopit, rakenne- 
analyysikieliopit ja kielioppikommentaarit. Koulukielioppeja luonnehtii 
hierarkkinen rakenne lukujen sisällä sekä semantiikan korostuminen. 
Myös sääntökieliopit ovat luokittelevia ja selittäviä mutta sisältävät run- 
saammin paradigmoja ja esimerkkejä sekä painottavat kielen muoto- 
aspekteja (esim. sanan sukua tai taivutusluokkaa eli deklinaatiota). 
Huomattavaa on, että sääntökieliopit ovat tulleet erityisesti alueilta, 
joissa latina ei ollut äidinkieli. Rakenneanalyysikielioppi (engl. parsing 
grammar) käyttää kysymys-vastausmetodia tekstin sanojen ominai- 
suuksien analyysiin. Kielioppikommentaarien kirjoitus oli suosittua 
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varsinkin Goo-7oo-luvulla; sillä tarkoitetaan lähinnä äidinkielisille opis- 
kelijoille suunnattuja seikkaperäisempiä analyyseja jostakin kieliopil- 
lisesta aiheesta verrattuna kommentoitaviin kielioppeihin. (Law 1997; 
Luhtala 2013; Harjunpää 2016.) Näitä myöhäisantiikin kielioppityyppejä 
käytettiin edelleen mallina keskiajan kielioppien kirjoituksessa. Uutena 
tyyppinä ilmaantui runomuotoinen kielioppi, kuten pedagogiseen käyt- 
töön tarkoitettu Eberhardus Bethunensiksen Graecismus (Luhtala 2013). 

Keskiajan loppuun saakka antiikin kielioppikirjoitus vaikutti vahvasti 
eurooppalaisessa kielenkuvauksessa tähdäten lähinnä käytännöllisiin ja 
normatiivisiin tarkoituksiin. Kun kuvauksen kohteena olivat olleet pää- 
asiassa latina ja kreikka, niin renessanssin aikana, kehittyvän kansallis- 
valtion idean sekä uskonpuhdistuksen myötä ilmestyivät jo ensimmäiset 
”kansankielten” kieliopit — espanjan, italian, ranskan, puolan ja mui- 
naiskirkkoslaavin kuvaukset. Ensimmäinen englannin kielioppi ilmes- 
tyi 1586. Vanhin säilynyt suomen kielen kielioppi on Turun akatemian 
ensimmäisen teologian professorin Eskil Petraeuksen laatima Linguae 
Finnicae brevis institutio ('lyhyt suomen kielioppi”) vuodelta 1649. Uudet 
kieliopit keskittyivät kehittyvien standardikielten kirjoitusasun ja ääntä- 
misen vastaavuusongelmiin sekä fonologisten ja morfologisten järjes- 
telmien kuvaukseen. Uutta oli silloisten vakiintuneiden sanaluokkien 
kyseenalaistaminen — ehdotettiin sekä tiiviimpiä että yksityiskohtaisem- 
pia luokitteluja (nykyisin sanaluokkien kategorisointi saattaa vaihdel- 
la yksittäisen kielen sisälläkin näkökulman ja tarkoituksen mukaan). 
Eurooppalaisten kielten lisäksi julkaistiin Uuden maailman kielten kieli- 
oppeja muun muassa taraskista (engl. Tarascan; Meksiko) 1558, ketSuas- 
ta (Peru) 1650, nahuatlista (Meksiko) 1571 ja guaranista (Paraguay) 1640. 
1600-1700-luvulla lisääntyivät japanin, persian ja kiinan kieliopit. (Ks. 
Oxford Handbook of History of Linguistics.) Sitä, miten eri puolilla maail- 
maa puhuttuja (usein uhanalaisia) kieliä on eri aikoina kuvattu ja miten 
niihin kuvauksiin on suhtauduttu, käsitellään tarkemmin tämän teok- 
sen artikkelissa Antropologinen lingvistiikka. 


Perinteisen kieliopin kehitys moderniin suuntaan lähti 1800-luvun 
kielihistoriallisesta ja vertailevasta eli komparatiivisesta kielen- 
tutkimuksesta. Vuonna 1786 englantilainen kielentutkija William Jones 
oli huomannut sanskritissa rakenteellisia yhtäläisyyksiä kreikkaan ja 
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latinaan mutta myös kelttiin, goottiin sekä muinaispersiaan. Tätä ha- 
vaintoa seurasi vireä kielten kehityksen ja niiden sukulaisuussuhteiden 
selvittämisen aikakausi; pohjana käytettiin ensin lähinnä äänneopillisia, 
myöhemmin myös muoto- ja lauseopillisia piirteitä. Esimerkiksi Franz 
Bopp vahvisti ajatuksen indoeurooppalaisen kieliperheen olemassaolos- 
ta vertaillen eri kielten verbintaivutuksia. Hän osoitti, että kaikilla näillä 
kielillä on sama kantakieli. Rasmus Rask ja Jacob Grimm puolestaan 
osoittivat, että kielten muutokset tapahtuvat systemaattisesti. Sen jäl- 
keen alettiin laatia rekonstruktioita oletetuista kantakielistä niiden haa- 
roja, tytärkieliä, vertaamalla. Luonnontieteiden mallia mukauttaen ns. 
nuorgrammaatikoiden koulukunta yritti selvittää kaavoja, joiden mu- 
kaan kielen muutoksia voitaisiin selittää. Myös Suomessa vallitsi yleise- 
nä kielitieteellisenä suuntauksena 1800-luvun lopulta aina 1950-luvulle 
asti historiallinen kielitiede — tutkijoita kiinnostivat suomen rakenteen 
ja murteiden lisäksi sen sukukielet, joiden rakenteiden taustalta löydet- 
tiin yhteisiä piirteitä (ks. Historiallinen ja vertaileva kielentutkimus tk.). 
Niin sanotun varhaisnykysuomen kaudella (noin 1820-1879), jolloin 


suomesta kehittyi täysipainoinen sivistyskieli ja maan virallinen kieli 
(1863), varsinkin opetuskielioppien tarve suureni. Luonteeltaan ja pää- 
määriltään preskriptiivisiä kielioppeja syntyi lisää, ja niitä kirjoitettiin 
ruotsiksi sekä suomeksi. Aikakauden kielikäsitykset heijastivat itä- ja 
länsimurteiden välistä ”taistelua” — kun ensimmäiset kieliopit ja raa- 
matunkäännökset perustuivat länsimurteisiin, nyt alkoi itämurteiden 
aseman vahvistuminen. 

Kun Ferdinand de Saussuren luentojen pohjalta laadittu kirja Cours 
de linguistique générale julkaistiin vuonna 1916, historiallis-vertailevan 
kielitieteen rinnalle kehittyi synkroninen deskriptiivinen kielitutkimus 
ja kielijärjestelmän kokonaisuuden korostaminen eli strukturalismi. 
Strukturalistien huomio kiinnittyi fonologian, morfologian ja syntaksin 
rakenteen sekä kielen omaksumisen säännönmukaisuuksien kuvauk- 
seen. Alettiin myös keskustella kielen relatiivisista ja universaaleista 
ominaisuuksista eli siitä, ohjaako kieli puhujan ajattelua vai ovatko 
kielen ominaisuudet päinvastoin ihmisen evoluution ja aivorakenteen 
tulos. Debatin avasivat yhdysvaltalaiset kielenantropologit Benjamin 
Lee Whorf ja Edward Sapir relativistien sekä kielitieteilijä ja kognitivisti 
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Noam Chomsky universalistien osalta. Nämä aiheet puhuttavat kielen- 
tutkijoita vielä nykyisinkin. Myös suomen kieliopin kuvaaminen alkoi 
kehittyä maailmansotien jälkeen, kun kansainväliset kielitieteelliset 
suuntaukset (kuten Chomskyn kehittämä generatiivinen transformaatio- 
teoria) alkoivat saada enenevässä määrin tilaa tutkimuksessa ja tieteel- 
linen keskustelu monipuolistui vähitellen. Aarni Penttilän vuonna 1957 
valmistunut Suomen kielioppi oli erikoinen siinä mielessä, että yleis- 
kielen rakenteen kuvaukseen oli sisällytetty myös siitä poikkeavia ja pu- 
hutun kielen rakenteita. Osmo Ikola (1964; 1974) ja Paavo Siro (1964) 
keskittyivät suomen lauseopin kuvaukseen. Siro kuvasi lauserakenteita 
logiikan sääntöjen pohjalta, autonomisena formaalisena järjestelmä- 
nä, korvaten lauseen toistuvat osiot symboleilla (merkeillä) päämäärä- 
nään käsitteiden mahdollisimman eksakti kuvaus. 1900-luvun lopun 
ja 2000-luvun aikana kieliopin tutkimus ja muu kielitiede on edelleen 
monipuolistunut ja kansainvälistynyt. (Suomen kielitieteen historias- 
ta ks. Karlsson 1997.) Vuonna 2004 ilmestyi tähän asti laajin suomen 
kieliopin esitys, Iso suomen kielioppi eli ISK (Hakulinen, Vilkuna, Korho- 
nen, Koivisto, Heinonen & Alho 2004), josta on vuonna 2008 toimitettu 
myös verkkoversio (VISK). 


3. Kuinka kieliopin tutkimusta harjoitetaan 


Kielioppeja laaditaan lähtien erilaisista kielikäsityksistä eli erilaisista 
kielen perusluonnetta koskevista oletuksista. Jotta kieliopin laatiminen 
olisi mielekästä, on kuitenkin taustalla oltava käsitys, että kielen rakenne 
on edes jossain määrin strukturoitunutta ja säännönmukaista. Muuten 
sääntöjen laatimiselle ei olisi järkeviä perusteita. Siitä, kuinka kattavasti 
kielen rakenne voidaan kuvata sääntöjen avulla, on luonnollisesti eri- 
laisia käsityksiä niin tutkimustraditioiden välillä kuin niiden sisälläkin. 
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3.1. Kieliopin tutkimuksen lähtökohta: kielen rakenne 
järjestelmänä 


Kieliopin kirjoittamisen lähtökohtana on, että kielen rakenne ainakin 
keskeisiltä osiltaan voidaan esittää järjestelmän muodossa siten, että 
kielen ilmiöt jakaantuvat yleisempiin kategorioihin (esimerkiksi sana- 
luokkiin) ja samaan kategoriaan kuuluvat ilmiöt (esim. substantiivit) 
käyttäytyvät samanlaisessa kontekstissa samalla tavalla. Toisin sanoen 
kategoriat tunnistetaan siltä pohjalta, miten eri elementit käyttäytyvät 
muodon ja distribuution osalta. Esimerkiksi suomessa toisen substan- 
tiivin attribuuttina olevat substantiivit saavat genetiivisijan, jos mikään 
poikkeussääntö ei ole voimassa (esim. Maijan/huomispäivän /pirun 
työpaikka). 

Käsitys kielen järjestelmäluonteesta vaihtelee vahvuudeltaan eri 
koulukunnissa. Esimerkiksi Noam Chomskyn (ks. esim. 1965; 1986; 
2000) generatiivisessa kielitieteessä kielijärjestelmän ajatellaan perus- 
tuvan ihmisen lajityypillisiin biologisiin valmiuksiin. Toiset tutkijat 
(esim. Foley & van Valin Jr. 1984) olettavat, että kielten kategoriat ovat 
samankaltaisia, koska ihmisten viestinnän tarpeet perustaltaan ovat sa- 
manlaisia kulttuurista riippumatta. Kielen keskeisten osien esittämiseen 
järjestelmänä voi suhtautua myös käytännöllisemmin: se on tiivis tapa 
esittää kielen ominaisuuksia mahdollisimman kattavasti riippumatta 
siitä, olettaako taustalle jotain sellaista järjestelmäluonteen ennalta mää- 
räävää tekijää kuin genetiikka tai sellaista järjestystä luovaa tekijää kuin 
inhimilliset viestinnän tarpeet. 

Kielten perusrakenteen kuvaukseen esimerkiksi kielitypologian 
tarpeisiin laaditaan kielijärjestelmän kuvauksia, joita kutsutaan myös 
referenssikieliopeiksi. Myös nämä mallit edellyttävät, että kielten järjes- 
telmä on olennaisilta osin kaikille kielille yhteinen ja voidaan laatia 
kielioppimalli, joka käy tuntemattomienkin kielten dokumentaation 
välineeksi ja jonka avulla kieliä voidaan vertailla yhteisellä mitalla. 
Vaikka nämä deskriptiiviset kieliopit on laadittu pelkistetyiksi, niihin 
pätevät siis samat peruslähtökohdat kuin muihinkin kieliopin mallei- 


hin. (Referenssikieliopeista tarkemmin ks. Kielten dokumentointi ja 
kieliopin kuvaus tk.) 
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3.2. Kieliopin tutkimuksen kiinnostuksen kohteita 


Kuten luvussa 2 on kerrottu, kieliopin kirjoittamisella on tuhansien 
vuosien historia takanaan. Niinpä nykyiset kategoriat perustuvat pitkäl- 
ti jo aiemmin kehitettyihin malleihin. Lauseopissa peruslauseenjäsenet 
subjekti ja predikaatti sekä pääsanaluokat substantiivi, verbi, adjektiivi 
jne. ovat antiikin peruja. Nykyään voidaan lähteä tarkastelemaan kieltä 
näiden perinteisten kategorioiden pohjalta, koska esimerkiksi sanaluok- 
kien morfosyntaktiset ominaisuudet (miten taivutetaan, missä lauseen- 
jäsenasemissa voivat esiintyä jne.) tunnetaan monilta osin hyvin. 

Vaikka kieliopin peruskategoriat ovat varsin vakiintuneet ja niiden 
pääasiallinen käyttäytyminen tunnetaan, silti tutkimusta tarvitaan. Kieli- 
opin tutkimuksella on, yksinkertaistetusti sanottuna, kolme erilaista tut- 
kimuksen aluetta: 


1. yksittäisten kielten rakenteellisten ominaisuuksien selvittäminen 
2. eri kielten kielioppien keskinäinen vertailu 
3. kielioppiteorian kehittäminen. 


Seuraavaksi käsittelemme lyhyesti kutakin näistä kolmesta alueesta. 
Yksittäisten kielten rakenteellisten ominaisuuksien selvittäminen. Yk- 
sittäiskielten, vaikkapa suomen kielen, rakenteessa on aina selvitettävää, 
esimerkiksi kielen rakenteiden keskinäisissä suhteissa. Lisäksi voidaan 
aina pyrkiä selvittämään yleisempiä ja kattavampia kuvauksia. Tämä tut- 
kimusalue on kaikkein tyypillisin ja tutuin, kuten myös edellä olevasta 
historiallisesta katsauksesta voi huomata. Yksittäisten kielten huolellinen 
kieliopillinen kuvaus toimii pitkälti muiden tutkimusalueiden pohjana. 
Eri kielten kielioppien keskinäinen vertailu. Eri kielissä samat kate- 
goriat käyttäytyvät hieman eri tavoin, vaikkapa sanajärjestyksen kannal- 
ta: missä järjestyksessä ovat subjekti ja predikaatti, missä järjestyksessä 
erilaiset attribuutit suhteessa pääsanaansa. Vaikka yksittäiset kategoriat 
eivät olekaan kielikohtaisia, niin kategorioiden joukko on. Suomen kie- 
li ei käytä hyväkseen kaikkia niitä fonologisia distinktiivisiä eli jonkin 
kielen äännejärjestelmän äänteitä toisistaan erottavia piirteitä kuin esi- 
merkiksi ruotsin kieli: esimerkiksi eroa [soinnillinen] vs. [soinniton] ei 
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suomen kieli käytä erottelemaan foneemeja, vaikka suomessakin toki 
on soinnillisia ja soinnittomia äänteitä. Sen sijaan ruotsin kielessä sa- 
nat pil 'nuoli' ja bil ’auto’ ovat minimipareja, jotka perustuvat klusiilien 
soinnillisuuseroon. 

Kielten keskinäisten kieliopillisten erojen ja yhtäläisyyksien vertailu 
on laajimmillaan typologista tutkimusta, ja sen avulla voidaan tehdä pää- 
telmiä, joita ei yhden kielen perustella voi tehdä. Koska aikojen kuluessa 
on tehty tutkimusta eri kielten sijajärjestelmistä, niin nykyään on mah- 
dollista ymmärtää vaikkapa suomen kielen sijajärjestelmää paremmin 
kuin vielä joitain satoja vuosia sitten (vrt. luku 2). Kielten rakenteiden 
vertailun tärkeä infrastruktuuri on nykyään vapaasti verkossa käytettä- 
vissä. Tunnetuimpia typologisia tietokantoja on maailman kielten raken- 
teiden kartasto WALS (The World Atlas of Language Structures; Dryer & 
Haspelmath 2013). Erilaisia typologisia tietokantoja yhdistää esimerkik- 
si Typological Database System, kun taas AUTOTYP-tietokanta tarjoaa 
raakadataa prosessoivan systeemin. Typologisesta kielitieteestä kerro- 
taan lisää tämän teoksen artikkelissa Kielitypologian menetelmät (ks. 


myös Kolehmainen, Miestamo & Nordlund 2013). 

Kapeamman näkökulman kielten vertailussa ottaa kontrastiivinen 
kieliopin kirjoitus, jonka tavoitteena on tutkia yleensä kahden kielen 
välisiä eroja ja yhtäläisyyksiä synkronisesti eli jossakin vaiheessa sa- 
manaikaisina havaittavina ilmiöinä ja niiden suhteina. Kontrastiivinen 
kielentutkimus, joka sai alkunsa 1960-1970-luvuilla, on osa typologi- 
sesti vertailevaa tutkimusta, mutta se ei sinänsä kuulu suoraan kieli- 
typologian alaan (Jorgensen 1982, 24). Yleisesti ottaen tämänkaltaista 
kielten vertailevaa tutkimusta ei voi pitää yhtenäisenä tutkimussuuntana 
vaan pikemmin tutkimusnäkökulmana, jota sovelletaan eri teorioiden ja 
menetelmien piirissä (ks. esim. K. Häkkinen 1987; Järventausta 2013). 
Kontrastiivisen tutkimuksen piirissä tähdätään myös hyvin erilaisiin 
päämääriin — sekä teoreettisiin että soveltaviin tarkoituksiin. Alun perin 
tämä suunta on lähtenyt vieraan tai toisen kielen oppimis- ja opetus- 
tarpeista, ja tutkimus on tarjonnut aineksia lähinnä virheanalyysimene- 
telmää varten (ks. esim. Sajavaara 1977; Johansson 2007). Nykyään sekä 
tutkimusmenetelmien että tutkimusaiheiden kirjo on hyvin laaja syntak- 
tisten rakenteiden vertailusta kontrastiiviseen keskustelututkimukseen. 
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Typologian ja kontrastiivisen kieliopin laheiseen alueeseen kuuluu 
vielä komparatiivinen eli historiallis-vertaileva kielitiede, joka tähtää ge- 
neettisesti läheisten kielten synkroniseen ja diakroniseen vertailuun. 
Historiallis-vertailevan kielitieteen metodologiaa käyttäen verrataan vaik- 
kapa tiettyä sanastoa etsimällä säännöllisiä äännevastaavuuksia tutkitta- 
vissa kielissä. Esimerkiksi uralilaisen kielikunnan kantakielen alkuperäi- 
siä sanoja selvitettäessä verrataan sanoja (kognaatteja) sukulaiskielissä 
ja päätellään mahdolliset (sääntöperäiset) äänne- ja merkitysmuutokset. 
(Historiallis-vertailevasta kielitieteestä ks. Anttila 1972; K. Häkkinen 
1990; J. Häkkinen 2013; Historiallinen ja vertaileva kielentutkimus tk.) 
Kielimuotoja ja niiden variaatioita vertaillaan myös dialektologiassa kes- 


kittyen murteisiin eli puhuttuun kieleen. 


Kielten vertailu voi auttaa ymmärtämään kielten eroja ja yhtäläisyyksiä 
ja sitä kautta myös vertailtavia kieliä itseään. Tässä on yksinkertainen 
esimerkki viron ja suomen vertailusta: 

1) Karu ronib puu otsa. 

2) Karhu kiipeää puuhun. 


Kontrastiivisen kieliopin kannalta viron ja suomen esimerkit osoittavat 

ainakin seuraavia eroja: 

e Fonologia: karu (vi) — karhu (su). h on hävinnyt likvidan r edeltä viron 
kieliopin rajoitusten vuoksi. 

e Syntaksi: puu otsa (vi) — puuhun (su). Virossa käytetään terminatiivista 
postpositiota otsa ('pàin', 'asti' jne.) ja suomessa illatiivisijaa. Tyy- 
pillinen ero suomen ja viron välillä onkin, että suomen paikallissija- 
ilmauksia vastaavat virossa postpositioilmaukset. Molempien kielten 
neutraali sanajärjestys on se, että subjekti (karu, karhu) edeltää predi- 
kaattia ja predikaattiverbi kongruoi subjektin persoonassa ja luvussa 
(ronib ja kiipeää ovat molemmat yksikön 3. persoonan muotoja). 

e Leksikko: ronima (vi) — kiivetä (su). Viron verbi ronima tarkoittaa myös 
'kontata' tai ’kaivautua läpi’ ja keskittää huomion ennen kaikkea ruu- 
miin liikkeisiin. Suomen kiivetä ilmaisee puhtaammin ylöspäin suun- 
tautuvaa vertikaalista liikettä. 
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Kielioppiteorian kehittäminen. Kieliopin teoria ei suinkaan ole vielä — 
jos koskaan — täysin valmis. Vanhastaan tunnettujen kategorioiden tar- 
kempi analyysi ja kielten vertailun avulla saatu uusi tieto kategorioista 
ja niiden ominaisuuksista on pohjana uusille teorioille. 

Esimerkkinä perinteisten kategorioiden tarkemmasta analyysista toi- 
mii vaikkapa Chomskyn (1974) ajatus, että sanaluokat substantiivi (N), 
verbi (V), adjektiivi (A) ja p-positio (P) voidaan esittää ”substantiivimai- 
suutta” ja ”verbimäisyyttä” kuvaavien piirteiden +/-N ja +/-V avulla: 
verbi on [-N, +V], substantiivi on [+N, -V], adjektiivi [+N, +V] ja p-positio 
[-N, -V]. Näin voidaan päästä yksinkertaisempaan kuvaukseen ja osoit- 
taa sanaluokkien keskinäiset suhteet entistä paremmin, kun esimerkiksi 
perinteisesti nomineiksi luokitellut sanaluokat substantiivi ja adjektiivi 
on kuvattu samalla piirteellä +N. Chomskyn ajatusta on toki kritisoitu 
ja muokattu, ja piirteiden toimivuutta kaikille sanaluokille on epäilty ja 
arvioitu uudelleen. Esimerkki kuitenkin kuvaa hyvin sitä, että kieliopin 
tutkimuksessa voidaan arvioida uudelleen niinkin ikivanhojen katego- 
rioden kuin sanaluokkien asemaa kielijärjestelmässä. 


3.3. Eri kielioppiteorioita ja niiden keskeisiä eroja 
Kieliopin tutkimuksessa ja mallintamisessa on hyvin paljon erilaisia 
koulukuntia ja traditioita, emmekä pyri tässä luetteloimaan tai kuvaa- 
maan niitä kaikkia. Esimerkkeinä erilaisista kielioppimalleista ovat vaik- 
kapa seuraavat (suluissa tradition perustaja tai keskeinen tutkija, johon 
koulukunta tavallisesti yhdistetään): 

Perinteinen kielioppi 

Generatiivinen kielioppi (Noam Chomsky) 


Kognitiivinen kielioppi (Ronald Langacker) 


Muitakin suosittuja ja merkittäviä traditioita näiden lisäksi toki 
on. Erityisesti kielitypologit käyttävät kuvaustensa perustana ns. 
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peruskielioppiteoriaa (ks. Kielitypologian menetelmät; Kielten doku- 


mentointi ja kieliopin kuvaus; Antropologinen lingvistiikka tk.). Seu- 
raavan vertailun tarkoituksena on näyttää esimerkinomaisesti, minkä 


tyyppisiin asioihin traditioiden ja koulukuntien erot pohjautuvat, ei an- 
taa kattavaa kuvaa kaikista kieliopin tärkeistä koulukunnista. 

Perinteinen kielioppi on lukijoille tuttu niin sanottu koulukielioppi. 
Se perustuu antiikin kreikkalaiseen filosofiaan. Erityisesti lauseenjäsen- 
nys sekä sanaluokat ja osin myös muoto-opilliset kategoriat (sija, aika- 
muoto, tapamuoto jne.) ovat antiikin tutkijoiden kehittämiä. Perinteinen 
kielioppi on osoittautunut käytännölliseksi kielen opetuksessa, ja sen 
kategoriat ovat taustalla myös uudemmissa kieliopin malleissa. Perintei- 
sen kieliopin ongelmiksi tieteellisen kielenkuvauksen mallina voidaan 
katsoa kategorioiden määritelmien yleisluontoisuus (esim. ”subjekti on 
lauseen tekijä”) sekä sen tapa keskittyä vain perusasioihin ja koota han- 
kalat ilmiöt jäännösluokkiin (esim. adverbiaali, indefiniittipronomini 
ym.). 

Generatiivisen kieliopin lähtölaukaukseksi katsotaan yleisesti Noam 
Chomskyn teos Syntactic Structures (1957). Uutuutena edeltävään struk- 
turalistiseen kielioppiperinteeseen oli ajatus, että epäsäännöllisyyttä 
lause- ja lausekerakenteeseen aiheuttavien ilmiöiden, kuten vaihtelevien 
sanajärjestysten, passiivirakenteiden, kysymysrakenteiden ja ellipsien, 
taustalle oletetaan yksinkertaisia lausekerakennesääntöjä noudattava 
syvärakenne. Näin lausekerakennesäännöt pysyvät yksinkertaisina ja 
argumenttirakenne voidaan kuvata syvärakenteessa täydellisenä. Hinta- 
na on se, että tarvitaan mutkikas säännöstö eli transformaatiosäännöt, 
joilla syvärakenteesta johdetaan pintarakenteet eli ne rakenteet, jotka 
kielenpuhuja tunnistaa hyväksyttäväksi kieleksi (ks. Kielitaju kielen- 


tutkijan työkaluna tk.) ja jollaisia todellisissa teksteissä esiintyy. Lause- 
oppi on chomskylaisessa generatiivisessa kieliopissa keskeinen osa- 


alue: fonologinen ja semanttinen tulkinta johdetaan lauserakenteista. 
Chomsky (1965) on korostanut, että generatiivisen kieliopin tavoitteena 
on kuvata kieli sellaisena kuin se on ihmismielessä. 

Chomskylaisesta generatiivisesta kielitieteestä on ajan kuluessa kehit- 
tynyt useita eri kielioppimalleja; esimerkiksi 1960- ja 1970-lukujen tait- 
teessa generatiivinen kielioppi jakaantui generatiiviseen semantiikkaan 
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ja tulkitsevaan semantiikkaan. Kielioppiteorioiden erkaantuminen pe- 
rustui lähinnä eri näkemyksiin siitä, mikä on kielen rakenteen ja kielen 
merkityksen keskinäinen suhde kielijärjestelmässä sekä kielen suhde 
ontologiaan: Generatiivinen semantiikka oletti merkityksen olevan en- 
sisijainen ja pyrki liittämään lauserakenteeseen myös merkityskatego- 
rioita. Tulkitseva semantiikka lähti siitä, että rakenne (lähinnä lause- 
rakenne) on ensisijainen merkitykseen nähden ja merkityksen kuvaus 
on pidettävä erillään lauserakenteen kuvauksesta. Ero on siis toisaalta 
kuvaustekninen, ja toisaalta se liittyy kielitieteilijän tapaan hahmottaa 
tutkimuskohteensa. Generatiivisesta semantiikasta kehittyi vähitellen 
mm. kognitiivinen kielioppi (Langacker 1987; 1991) ja tulkitsevasta 
semantiikasta mm. minimalismi (Chomsky 1995) ja konseptuaalinen 
semantiikka (Jackendoff 1983; 1990). Minimalismin ja konseptuaali- 
sen semantiikan keskeinen ero on se, että minimalismi korostaa lause- 
rakenteen ensisijaisuutta merkitykseen ja fonologiaan nähden, kun taas 
konseptuaalinen semantiikka näkee eri tasot rinnakkaisina eikä toisil- 
leen alisteisina kielen alajärjestelminä. Suomen kielestä generatiivista 
tutkimusta ovat tehneet eri aikoina muiden muassa Kalevi Wiik, Fred 
Karlsson, Auli Hakulinen, Osmo Ikola, Urpo Nikanne, Geda Paulsen, 
Oksana Petrova ja Michaela Pörn. 

Kognitiivinen kielioppi eroaa generatiivisesta kieliopista ja myös 
perinteisestä kieliopista monessa teoreettisesti perustavanluonteises- 
sa suhteessa. Kognitiivisen kieliopin keskeisin kehittäjä on Ronald 
Langacker (1987; 1991; 2016). Teorian mukaan kielioppi on raken- 
teeltaan polaarinen ja perustuu toisaalta fonologiaan, toisaalta seman- 
tiikkaan. Tämä kaksinapaisuus koskee teorian mukaan kaikkia kielen 
perusyksiköitä, joita ovat fonologinen, semanttinen ja symbolinen yk- 
sikkö. Fonologian ja semantiikan välillä on jatkumoluonteinen suhde, ei 
selviä rajoja. Tähän liittyy yksi kognitiivisen kieliopin keskeinen teesi eli 
kieliopin selittäminen semanttisten rakenteiden konventionaalistuneen 
symbolisaation kautta. Kieli on Langackerin (1987, 11) mukaan luonteel- 
taan symbolinen muodostaen avoimen joukon kielellisiä merkkejä sekä 
ilmaisuja, joilla on sekä fonologinen että semanttinen representaatio. 
Kielen perusyksiköt sisältyvät skeemoihin eli ihmismielen tietoraken- 
teisiin, jotka ohjaavat ja jäsentävät kokemuksia ja käsityksiä maailmasta. 
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Skeemat muodostavat laajempia verkostoja. Esimerkiksi kategorioiden 
”hedelmä” ja ”omena” välillä vallitsee ns. täysin skemaattinen suhde 
(engl. full schematicity), kun taas ”hedelmä” ja ”tomaatti” ilmentävät 
osittain skemaattista suhdetta (engl. partial schematicity); käsitteet ”he- 
delmä”, ”omena” ja ”tomaatti” muodostavat yhdessä skemaattisen ver- 
koston. (Langacker 1987, 68—75; ks. myös Leino 1993.) 

Yksi tämän teorian keskeisiä käsitteitä on jatkumo: syntaksin, morfo- 
logian ja leksikon välillä ei ajatella olevan selvää rajaa, eikä kieliopin kat- 
sota koostuvan erillisistä komponenteista vaan ainoastaan jatkumoista. 
Leksikon katsotaan muodostavan kieliopin kanssa selkeästi erottamat- 
toman symbolisten rakenteiden jatkumon. Lauseopin ei katsota olevan 
itsenäinen kieliopin osa, vaan sekin on symbolinen representaatio, joka 
sisältyy semanttiseen representaatioon. Semanttisella representaatiolla 
ei oleteta olevan syvärakennetta, eikä rakenteiden välillä ole johtosuhtei- 
ta, transformaatioita. (Langacker 1987, 2-3.) Kognitiivinen kielioppi olet- 
taa kielijärjestelmän perustuvan prototyyppisiin eli asteittaisiin katego- 
rioihin, vastakohtana esimerkiksi generatiivisen kieliopin selvärajaisiin 
klassisiin kategorioihin. Toisin sanoen kognitiivisessa kieliopissa kie- 
len kategorioiden välillä nähdään olevan asteittaisia eroja, ja kategoriat 
saattavat ominaisuuksiltaan kuulua sekä selviin että vähemmän selviin 
tapauksiin (kielitieteellisistä kategoriointiperiaatteista ks. Taylor 1989, 
54-59). 

Semanttinen rakenne on kognitiivisessa kieliopissa kielikohtainen; 
kieliopin ei oleteta olevan universaali. Semanttisia rakenteita käsitellään 
kognitiivisessa kieliopissa käsiterakenteen kautta. Se heijastaa konven- 
tionaalisia mielikuvia (engl. conventional imagery) eli sitä tapaa, miten 
tilanteita käsitteistetään. Käsitteistyksellä (engl. conceptualization) tarkoi- 
tetaan joko kielenkäyttäjän tulkintaa tilanteesta, jota hän kielentää, tai 
kieleen vakiintunutta tapaa jäsentää tilanteita. Mielikuvallisuus (usein 
myös termeillä metafora tai figuratiivinen kieli kutsutut ilmiöt) käsitetään- 
kin kieliopin keskeisenä ilmentymänä. Langackerin (1987, 110) mukaan 
mielikuvallisuus on ajattelu- tai ilmaisukeino, jolla konstruoimme taju- 
tun tilanteen vaihtoehtoisina mielikuvina. Langacker (1987, 63) tekee 
selväksi, että kielioppi ei ole rakenteita generoiva systeemi vaan kielellis- 
ten yksiköiden varasto (”simply an inventory of linguistic units”). 
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Samoin kuin generatiivisen kieliopin myös kognitiivisen kieliopin 
tavoitteena on kuvata kieli sellaisena kuin se ihmisen mielessä on. 
Kognitiivinen kielioppi eroaa generatiivisesta kieliteorista siinä, että se 
ei sisällytä kielen rakenteeseen synnynnäisiä mekanismeja. Teoria pyrkii 
kuvaamaan kieltä ”psykologisesti todellisena”. Taustaoletuksena on aja- 
tus, että kielen rakenteiden kuvaus on sellaisenaan hypoteesi kognitiivi- 
sesta representaatiosta (Langacker 1987, 56). Toisin sanoen kielioppi on 
olemukseltaan psykologinen representaatio, joka Langackerin (1987, 57) 
mukaan ei kuitenkaan ole välttämättä autonominen eikä selvästi rajatta- 
vissa eikä muusta kognitiosta erillään oleva psykologinen ilmiö. 

Kielioppia tarkastelee psykologisesta ja semanttisesta näkökulmasta 
myös kognitiivisen kielitieteen edustaja Leonard Talmy (ks. esim. 1985; 
1988; 2000), jonka näkemyksessä kieli on yksi (suhteellisen) selvästi 
erotettava kognitiivinen systeemi esim. havainnointi- ja päättelykyvyn, 
muistin, kulttuurijärjestelmän ja motorisen hallinnan ohella. Nämä 
systeemit eroavat esimerkiksi Fodorin (1983) selvärajaisista moduu- 
leista siinä, että omien uniikkien ominaisuuksien lisäksi niillä voi olla 
rakenteellisia yhtymäkohtia joidenkin tai kaikkien muiden systeemien 
kanssa. (Talmy 2000, 15-16.) Talmy on kognitiivisen kieliopin tärkeä 
kehittäjä, ja hän on ottanut käyttöön ja kehittänyt monia nykyään laa- 
jasti sovellettavia käsitteitä, kuten voimadynamiikan ja fiktiivisen liikkeen. 
Hän on perinpohjainen semanttis-kognitiivisten kategorioiden erittelijä 
— joitakin esimerkkejä ilmiöistä, joita Talmy on analysoinut, ovat liike 
ja kausatiivisuus. 

Suomessa kognitiivisen kieliopin ideoita on sovellettu esimerkiksi 
paikallissijojen ja adpositioiden kuvaamiseen, verbisemantiikkaan ja 
metaforatutkimukseen. Tutkijoita, jotka ovat tehneet työtä tämän tra- 
dition parissa, ovat esimerkiksi Pentti Leino, Tiina Onikki-Rantajääskö, 
Tuomas Huumo, Jaakko Leino, Ilona Herlin ja Jari Sivonen. 

Erilaisilla kielioppiteorioilla saattaa siis olla sekä yhtymäkohtia että ra- 
dikaalejakin eroja keskenään. Taulukkoon 1 on koottu edellä käsiteltyjen 
kielioppimallien joitain olennaisia eroja ja yhtäläisyyksiä. 


LUKU 17 KIELIOPIN TUTKIMUS JA KIELIOPPITEORIAT 765 


Taulukko 1. Perinteisen kieliopin, generatiivisen kieliopin seka kognitiivisen kieli- 


opin vertailu. 


Perinteinen 
kielioppi 


Generatiivinen 
kielioppi 


Kognitiivinen 
kielioppi 


Kognitiivinen 
ulottuvuus 


Ei: Kognitiivinen ulottu- 
vuus ei ole keskeinen osa 
kuvaustraditiota. 


Kyllä: Kieliopin 
laadinnan 
tavoitteena on 
kuvata ja selittää 
puhuja-kuulijan 


Kyllä: 
Kielenkuvauksen 
tavoitteena on kuvata 
kieli niin, että se 
vastaa kielenkäyttäjän 


rioihin, jotka määritellään 
usein tyypillisten tapausten 
mukaan. Esimerkiksi lause- 
opissa lauseen subjekti 
määritellään yleensä tyypil- 
lisen tapauksen mukaisesti 
lauseen ilmaiseman toi- 
minnan tekijäksi. Toisaalta 
vaikkapa määritteiden ja 
pääsanojen suhteet pyritään 
selvittämään ja kuvaamaan 
formaalisti. 


Formalisointi on 
keskeinen osa 
metodologiaa. 


kielikyky. mentaalista hahmo- 
tusta 
Formalisointi Ei: Kuvaus perustuu katego- | Kyllä: Ei: Formalisointi ei 


ole keskeinen osa 
kielenkuvauksen 
metodologiaa, mutta 
kuvauksia pyritään 
kuitenkin esittämään 
systemaattisella 
tavalla kuvioina. 


Kielijärjestelmän 
osa-alueiden 
erillisyys 
(modulaarisuus) 


Kyllä: Kieliopin eri osa-alueet 
(äänneoppi, lauseoppi, 
muoto-oppi). 


Kyllä: 
Modulaarisuus 
on keskeinen osa 
teoriaa. 


Ei: Modulaarisuuden 
kieltäminen on osa 
teoriaa. 


Kielen ”tärkein” 
osa-alue tai 
teoriaperinteen 
fokusointikohde 


Universaalisuus 
vs. relatiivisuus 


Ei selvää fokusaluetta: 
Äänneoppia, muoto-oppia 
ja lauseoppia on kuvattu 
erikseen. 


Ei selvästi kumpikaan. Kieliä 
on kuvattu klassisten kielten 
mallin mukaisesti, mikä on 
eräänlaista universalismia. 
Tämä ei kuitenkaan ole 
teorianmuodostuksen 
keskeinen osa vaan perustuu 
perinteeseen ja käytännön 
tarpeisiin. Lisäksi klassisten 
kielten kielioppeja on 
käytetty mallina kaikkien 
kielten kuvauksessa. 
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Syntaksi 

on katsottu 
keskeiseksi osaksi 
kielen rakennetta. 


Kielellinen 
universalismi: 
Luonnollisilla 
kielillä oletetaan 
olevan yhteinen 
kielijärjestelmän 
toteutumista 
säätelevä osa. 


Semantiikka on kes- 
keinen osa kieltä, kos- 
ka merkityksen kat- 
sotaan olevan myös 
muodon perusta. 


Kielellinen relativismi: 
Kielten välisten 
samankaltaisuuksien 
katsotaan perustuvan 
muihin kuin 
kielellisiin tekijöihin, 
esimerkiksi siihen, 
että ihmiskeho toimii 
kaikilla kielenpuhujilla 
samalla lailla. 


Vaikka edellä on käsitelty kolmea traditiota, on hyvä muistuttaa luki- 
jaa siitä, että kielioppitraditioita on paljon. Mainittakoon tässä vielä 
vaikkapa M. A. K. Hallidayn (1994) ajatuksiin perustuva systeemis- 
funktionaalinen kielioppi, jossa kielen rakenne ja lauseen merkitys jae- 
taan kolmeen tasoon: rakenteen tasoon (lausekerakenne), syntaktisten 
funktioiden tasoon (lauseenjäsenet) ja semanttisten funktioiden tasoon 
(argumenttirakenne). Nämä kolme tasoa toimivat samanaikaisesti, ja ne 
kuvataan kukin erikseen. Systeemis-funktionaalinen kielioppi painottaa 
mentaalisten prosessien sijasta kontekstin merkitystä kielelliselle raken- 
teelle. Teoria tutkii vuorovaikutuksen roolia kielen käytössä kysyen, miten 
kieltä käytetään tiettyjen tavoitteiden saavuttamiseksi. Nimityksen toinen 
osa, funktionaalinen, viittaa kielenkäytön ensisijaisuuteen. Nimityksen 
ensimmäinen puoli, systeeminen, puolestaan tulee siitä, että SF-kieliopissa 
tarkastellaan myös syntagmaattisia suhteita eli kielenyksiköiden suhteita 
toisiin yksiköihin, joiden kanssa ne esiintyvät peräkkäin samassa jaksos- 
sa. Suomessa alan tutkijoita ovat esimerkiksi Susanna Shore, Katarzyna 
Wojciechowicz, Vesa Heikkinen, Eija Ventola ja Yrjö Lauranto. 


3.4. Kielioppiteorian soveltaminen 


Kielioppia on käytetty vuosituhanten aikana erityisesti kielten opettami- 
seen sekä kielenhuoltoon. Vieraita kieliä on kuvattu kielioppien avulla, 
ja kieliopin sääntöjä on käytetty opetuksessa yhdessä sanakirjojen kans- 
sa kielijärjestelmän opettamiseen. Kielenhuoltoon kielioppia on käytetty 
siten, että kieliopin sääntö on tulkittu ohjeeksi oikeasta rakenteesta eikä 
ainoastaan kielen kuvaukseksi. Esimerkiksi suomen kielen possessiivi- 
suffiksit jäävät puhekielessä useimmiten pois, mutta kirjoitetussa kie- 
lessä niitä pitää käyttää erityisesti silloin, kun persoonapronomini toimii 
genetiiviattribuuttina: minun kirjani, sinun kirjasi, hänen kirjansa. Kir- 
joitetussa asiatekstissä possessiivisuffiksin pois jättäminen olisi virhe. 
Kielenhuollolla hillitään kielellisten rakenteiden variaatiota asiatyylisissä 
teksteissä. 

Vaikka leksikografiassa päähuomio on sanoilla, tieto kuvattavan kie- 
len kieliopista on leksikografeille välttämätön. Kuten jo johdantoluvussa 
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todettiin, sanaston ja kieliopin välinen raja ei ole selvä, ja niinpä myös- 
kään kielioppi ja sanakirja eivät ole jyrkästi erotettavissa (Kytömäki 
1991). Jokainen sana sisältää tietoa sen funktiosta laajemmassa ympä- 
ristössä, ja sanat saattavat olla esimerkiksi johtamisprosessin tulosta. 
Myös sanojen kategorisointi sekä näkökulma siitä, mikä kuuluu sana- 
kirjaan ja mikä ei, riippuu teoreettisesta lähestymistavasta. Sanakirjan 
kirjoittajalle tämä on olennainen käytännön kysymys. Jos lähdetään 
vaikka konstruktiokieliopin? esittämästä oletuksesta, että sekä sanat että 
sitä laajemmat yhdistelmät (esimerkiksi transitiivilause, kollokaatiot, 
idiomit jne.) ovat tallentuneet kielenkäyttäjän mieleen periaatteessa sa- 
mantyyppisinä muodon ja funktion pareina, niin sekä perinteiset sanat 
että niiden konstellaatiot tulisi listata sanakirjaan. Tällä tavalla sanakirjat 
voisivat jopa ”nielaista” kieliopit, kuten konstruktiokieliopin radikaalein 
edustaja William Croft yhdessä Logan Suttonin (2014) kanssa toteaa. 

Kieliopin tutkimusta sovelletaan opetuksen, kielenhuollon ja 
sanakirjatyön lisäksi moniin muihinkin tarkoituksiin. Esimerkiksi 
kieliteknologiset sovellukset ovat nykyisin nopeasti kehittyvä ala, johon 
kuuluu hyvin erilaisia sekä puhetta että tekstejä käsittäviä alueita aina 
äänipohjaisista dialogijärjestelmistä konekäännös- tai kielenopetusohjel- 
miin. Kieliopin tutkimusta tarvitaan lisäksi muun muassa uhanalaisten 
kielten elvytyshankkeissa (ks. Antropologinen lingvistiikka tk.). Tietoa 
kieliopista tarvitaan myös kielellis-kognitiivisten oireiden tutkimuksessa 
ja hoidossa, esimerkiksi neuropsykologiassa ja logopediassa (ks. Psyko- 
ja neurolingvistiikka tk.). 


3.5. Tutkimuksen kulku 


Kieliopillinen tutkimus etenee havaintojen tekemisestä teorian- 
muodostukseen tutkimuksen tavoitteiden mukaisesti. Tutkimusperin- 
teen vakiintuneisuuden ansiosta yleensä kielen havainnoinnissa voidaan 
käyttää jo vakiintuneita kieliopin kategorioita. Havainnointia voidaan 
tehdä eri tavoin. Esimerkiksi: 
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1. Voidaan tunnistaa jostain kieliaineistosta (esimerkiksi nauhoituk- 
sesta tai kirjoituksesta) tutkimuksen kohteena olevia ilmiöitä (vaik- 
kapa sijamuotoja, pronomineja, tavuja, nasaaliäänteitä tai muita 
kieliopin tutkimuksen kategorioita) ja selvittää tarkemmin niiden 
esiintymistä. Näin saadaan ilmiöistä tarkempaa tietoa ja voidaan 
selvittää, kuinka tarkkailtava kategoria toimii tutkitussa kielessä, 
sekä myös tarkentaa aiempia oletuksia: Onko kyseisessä kielessä 
tätä kategoriaa (onko esim. suomen kielen äänneoppiin oletettava 
piirre [soinnillinen], vaikka sitä ei tarvita suomen äännejärjestel- 
män yksiköiden erottamiseen eikä se siis ole suomen kielessä dis- 
tinktiivinen)? Pitääkö kielessä jotkin kategoriat yhdistää (pitäisikö 
esim. suomen muoto-opissa kategoriat tempus ja modus yhdis- 
tää, kun niitä ilmaisevat tunnukset eivät esiinny koskaan samassa 
sananmuodossa) vai pitääkö olettaa joitain kokonaan uusia katego- 
rioita (esimerkiksi jakamaan suomen kielen indefiniittipronomi- 
nien sekavaa joukkoa)? 

2. Havainnoinnin kohteena voivat olla eri kielten kielioppien valmiit 
kuvaukset. Tämä on tyypillistä erityisesti typologisessa kielentutki- 
muksessa, jossa selvitetään kielen rakenteiden ilmenemistä maail- 
man kielissä (ks. Kielitypologian menetelmät tk.). 

3. Kun tunnetaan kielen rakenne aiemman tutkimuksen pohjalta, 


voidaan laatia testilauseita, joiden ominaisuudet tunnetaan, ja 
koettaa, miten jonkin muuttujan vaihtaminen vaikuttaa kielen- 
puhujan tulkintaan (aiheesta enemmän tämän teoksen luvussa 
Kielitaju kielentutkijan työkaluna). 


Kun aineisto on hankittu, pyritään sovittamaan havainnot kieliopin ku- 
vaukseen niin, että uusi kieliopin kuvaus on järjestelmä, joka vastaa ai- 
neistosta saatuja havaintoja ja osoittaa, mikä on mahdollinen rakenne ja 
mikä ei. Kieliopillisten kuvausten keskinäisen paremmuuden arviointi 
on yksi tutkimuskohde, ja sen tärkeyttä on generatiivisessa kieliopissa 
korostanut erityisesti Chomsky (1965). 
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3.6. Kieliopin suhteet muihin kielen osa-alueisiin ja niiden 
tutkimukseen 


Kieliopin tutkimus käsittelee kielen keskeistä osaa, rakenteen muodos- 
tamaa järjestelmää, ja on siinä mielessä kielentutkimuksen keskiössä. 
Sen vuoksi yhteydet muihin kielen osa-alueisiin ovat kiinteät eikä aina 
ole selvää, mitkä ilmiöt pitää laskea osaksi kielioppia ja mitkä jätetään 
kieliopin ulkopuolelle. Selvää luonnollista rajaa ei olekaan, erityisesti, 
kun pyritään erottamaan vaikkapa seuraavat kielen osa-alueet: 

Sanasto: Sanat muodostuvat äänteistä, ne esiintyvät aina jossain 
muodossa ja liittyvät toisiinsa lauseiksi ja lausekkeiksi. Niinpä sanasto 
voidaan myös laskea osaksi kielioppia, koska äänneoppia, muoto-oppia 
ja lauseoppia ei voi soveltaa ilman sanoja. Perinteisesti on tehty jako 
kielioppiin ja sanastoon, mutta kielijärjestelmää ei voi kuvata ilman sa- 
nojen kuvausta. 

Merkitys: Kieliopin tutkimusta ei voi jyrkästi erottaa semantiikasta, 
koska kieliopin jokainen osa on kytköksissä merkitykseen. Foneemit on 
perinteisesti määritelty pienimmiksi merkitystä erottaviksi yksiköiksi, ja 
kielen foneemit perustellaan minimipareilla (esimerkiksi suomen lik- 
vidat [l] ja [r] ovat eri foneemeja, koska on sellaisia minimipareja kuin 
esim. kaula — kaura ja lepäisin — repäisin). Muoto-opin muodoilla on 
yleensä jokin oma tyypillinen merkitysalueensa: tempukset kuvaavat 
aikaa, monikon tunnus useutta jne. Lauserakenteen muutos voi myös 
vaikuttaa lauseen merkitykseen, esimerkiksi korosteisuuteen (vrt. Kou- 
lulaisille tarjotaan näkkileipää [neutraali korostus] — Näkkileipää koululai- 
sille tarjotaan [näkkileipä on korostetussa asemassa: nimenomaan näkki- 
leipää eikä jotain muuta!]). 

Kielen käyttö ja vuorovaikutustutkimus: Koska kieli on ensisijaisesti 
ihmisten viestinnän ja vuorovaikutuksen väline, kieliopin on sopeudut- 
tava kielen käyttötilanteisiin. Siksi on tärkeää selvittää, kuinka kielen ra- 
kenne toimii eri tilanteissa. (Aiheesta enemmän tämän teoksen luvussa 
Keskustelunanalyysi ja vuorovaikutuslingvistiikka.) 
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4. Yhteenveto 


Tässä artikkelissa on käsitelty kieliopin tutkimusta. Tiivistetysti artikke- 
lin keskeiset huomiot ovat seuraavat: 


1. Kieliopin tutkimus on kielijärjestelmän tutkimusta rakenteen osal- 
ta. Kieliopin tutkimuksen ja kielioppien laatiminen edellyttää sitä, 
että kielessä on ainakin jonkin verran sellaista säännönmukaisuut- 
ta, että siitä voidaan laatia kielioppi. Kieliopin tutkimus perustuu 
säännölliseen havainnointiin ja loogiseen päättelyyn kuten muukin 
tieteellinen tutkimus. Tutkimuksen tavoitteena on luoda mahdolli- 
simman kattavia ja elegantteja kuvauksia yksittäisten kielten raken- 
teiden järjestelmistä sekä kielten välisistä yhtäläisyyksistä ja eroista. 

2. Eri traditiot poikkeavat toisistaan niin kuvauksen kohteen määrit- 
telyssä kuin kielijärjestelmän luonteen hahmotuksessa tai mene- 
telmässä, jolla järjestelmää tutkitaan ja kuvataan. 

3. Kielioppeja on tarvittu muun muassa kielten opetuksen sekä 
oikeakielisyyden tarpeisiin. Niinpä kelioppien laatimisella onkin 
tuhansien vuosien perinne, ja myös suomen kielen kielioppeja on 
kirjoitettu jo neljänsadan vuoden ajan. 

4. Kieliopin alaan kuuluvien ilmiöiden rajaaminen ei ole itsestään 
selvää tai perustu sellaisenaan havaintoon: rajan vetäminen kieli- 
opin ja semantiikan tai kieliopin ja leksikon väliin edellyttää 
teoreettista näkemystä koko kielijärjestelmästä ja siksi eri tutki- 
mustraditiot ja kielioppimallit vetävät rajan eri kohtiin — tai ovat 
vetämättä rajaa lainkaan. 


Aiheesta lisää: 


Itkonen, Esa. 1991. Universal History of Linguistics: India, China, 
Arabia, Europe. Amsterdam: John Benjamins. 


Karlsson, Fred. 2015 [1994]. Yleinen kielitiede. (5. p.). Helsinki: Gaudeamus. 
Strazny, Philipp (toim.). 2005. Encyclopedia of Linguistics. London: 
Routledge. 
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VIITTEET 


1 Rättyä (2014) sisällyttää kielitiedon alaan myös oikeakielisyyteen ohjaavan eli preskriptii- 
visen kieliopin ”metakielen”, esimerkiksi kirjakielen oikeinkirjoitusohjeistukset. 

2 Konstruktiokielioppi on suuntaus, jonka mukaan kieliopin pohjana ovat konventionaa- 
liset muodon ja merkityksen yhteenliittymät. Eri kuvausmalleissa konstruktion käsite 
ja sen asema yleisessä kielijärjestelmässä vaihtelevat jonkin verran (ks. esim. Fillmore 
1988; Goldberg 1995; Croft 2001; Östman & Fried 2004). 
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"To put it crudely: it's got philology in there, whatever the label 
says.” (Nikolaus Wegmann) 


Mikä? 

Filologisiksi menetelmiksi kutsutaan perinteisiä tekstintutkimuksen me- 
netelmiä, joissa ydinajatuksena on vahvaan kielitaitoon ja tekstin synty- 
kontekstin tuntemukseen nojaten ymmärtää, mitä tekstissä oikeastaan 
sanotaan. Filologian keskiössä ovat vanhat tekstit, eikä se aina ole vain 
kieleen kohdistuvaa tutkimusta kapeasti ymmärrettynä. 

Katso myös: 

Luku 11 Historiallinen korpuslingvistiikka 


Luku 15 Historiallinen ja vertaileva kielentutkimus 


Luku 20 Tekstintutkimus 
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1. Johdanto 


Tässä artikkelissa pohdimme, millaisia merkityksiä filologialle on an- 
nettu ja edelleen annetaan ja millaista on filologisen tutkimuksen 
tekeminen. Käsittelemme lyhyesti myös filologian suhdetta sen lähi- 
tutkimusaloihin. Lähdemme siitä (kenties optimistisesta) olettamukses- 
ta, että filologian olemuksen voi ylipäätään tiivistää tämän kirjan tarpei- 
siin, vaikka eklektisyys menetelmien ja kysymyksenasetteluiden suhteen 
on alalla yleistä, mikä johtaisi pikemminkin pluralisoivaan tulkintaan. 
Käsittelemme tässä artikkelissa historiallisia seikkoja laajemmin kuin 
kenties missään muussa tämän teoksen artikkelissa; tämä on helposti 
puolustettavissa sillä, että filologian historia on paitsi hämmästyttävän 
pitkä, noin 2 300 vuotta, myös ylipäätään kaikenlaisen kielentutkimuk- 
sen historiaa. 

Yleisesti voidaan sanoa, että filologisella tutkimuksella, jonka koh- 
teena ovat laveasti määrittäen vanhat tekstit, on merkittävä rooli sillan- 
rakentajana menneen ja nykyisen välillä. Tekstien ymmärrettäväksi te- 
keminen uusintaa sukupolvi toisensa jälkeen mahdollisuutta tarkastella 
ihmisyyttä ja siihen liittyviä asioita menneisyydessä. Verrattuna mihin 
tahansa muuhun säilyneeseen materiaaliin tekstien näistä asioista tar- 
joama kuva on rikkain ja eksplisiittisin. 

Aluksi on syytä kysyä, mitä filologialla oikeastaan tarkoitetaan. Vas- 
taus tähän riippuu siitä aikakaudesta, jota koskevaksi kysymys määri- 
tellään. Sanan etymologiasta on hyvä aloittaa. Kreikan filologos on kir- 
jaimellisesti ”logosta rakastava”. Logos puolestaan voi viitata kieleen ja 
eritasoisiin ilmiöihin kielessä, kuten lauseeseen, argumenttiin tai sa- 
naan. Kaikkein vanhimmissa lähteissä filologi onkin ylipäätään puhu- 
mista tai puheita rakastava ihminen ja filologia siis rakkautta, joka koh- 
distuu argumentointiin tai kieleen ja kirjallisuuteen yleensä. Antiikin 
maailmassa työtä, jonka tunnistamme filologin työksi — siis editioiden 
(ks. alla) ja kommentaarien laatimista sekä tekstin ilmiöiden tutkimista 
— tekivät ns. grammaatikot (kr. grammatikoi, lat. grammatici). Sanalla filo- 
logia tuohon työhön on viitattu vasta 1500-luvun loppupuolelta lähtien. 
Ennen 1800-lukua filologialla viitattiin kaikenlaiseen kieleen liittyvään 
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tutkimukseen, joskin ennen kaikkea sellaiseen, johon liittyi jokin teks- 
tuaalinen ongelma, kuten tyypillisesti muinaiskielillä kirjoitettuun ma- 
teriaaliin, oli se sitten kreikkaa, hepreaa tai sanskritia. Ennen kielitieteen 
tai lingvistiikan käsitteen syntyä 1800-luvulla filologiaan kuuluivat niin 
yksittäisten kielten ja niiden historian tutkimus kuin kielen alkuperään 
ja luonteeseen liittyvät pohdinnat. Läheisesti filologiseen tutkimukseen 
liittyivät myös retoriikan, historian ja kulttuurin tutkimus sekä mennei- 
syyden materiaalisten jäänteiden tutkimus — esimerkiksi historia ja ar- 
keologia ovat edelleen läheisiä ja tärkeitä monille filologeille. Kielitieteen 
syntymisen myötä voidaan filologian katsoa menettäneen asemiaan. 
Vastakkainasettelu tiivistyy 1800-luvun puolivälissä vaikuttaneen August 
Schleicherin muotoiluun lingvistiikasta ihmistä koskevana ”luonnon- 
tieteenä” (sa. Naturwissenschaft) ja filologiasta jonkinlaisena ”tulkinta- 
tieteenä” tai ”hengentieteenä” (sa. Geisteswissenschaft). Käsitteiden tasolla 
eroa ei välttämättä kuitenkaan tehty: filologia jäi terminä elämään mo- 
nessa yhteydessä viitaten kielentutkimukseen yleensä. 


2. Filologia ennen ja nyt 
2.1. Määritelmiä ja lähtökohtia 


Filologia on vuosisatojen aikana määritelty monella eri tavalla. Tavalli- 
simmin filologiasta puhutaan nykyisin klassillisten kielten yhteydessä, 
jossa kaikki tutkittava materiaali on luonnollisesti vanhaa, vaikkakaan 
ei välttämättä peräisin antiikista; myös esimerkiksi Bysantin kreikkaa ja 
keskiajan jälkeen kirjoitettua, suurelta osin tieteellistä uuslatinaa tutki- 
taan. Myös muiden kielten yhteydessä filologia yhdistetään vanhoihin 
aineistoihin ja kielihistoriaan, mutta diakronisen, kielen muuttumista 
kuvaavan tutkimuksen sijaan filologinen tutkimus on usein synkronista, 
eli se keskittyy tietyn hetken tai kauden tilaan — vaikkapa yhden tekstin 
tai tekstistön ilmiöiden kuvaamiseen ja selittämiseen — eikä kielimuo- 
don kehittymiseen ajan myötä. Kielestä riippumatta keskeistä on se, että 
filologia tieteellisenä lähestymistapana keskittyy teksteihin. Se ei rajaa 
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kiinnostustaan ainoastaan kirjallisuuteen perinteisessä mielessä: filo- 
logit tutkivat kaikenlaista kirjoitettua materiaalia genreen, säilymisalus- 
taan tai kirjoittajaan katsomatta. 

Filologia on myös toisinaan määritelty kulttuurin tutkimiseksi kielen 
avulla (ks. esim. Anttila 1989; Altschul 2010). Vanhastaan filologisessa 
mielessä kiinnostavia ovatkin olleet paitsi eritasoiset kieleen ja kirjalli- 
suuteen liittyvät kysymykset (lauseoppi, leksikologia, retoriset keinot, 
tekstilajit jne.) myös muunlaiset kulttuuriin liittyvät kysymykset, kuten 
yhteiskunnalliset instituutiot, tavat, uskonto, oppihistoria jne. Kulttuu- 
rin tutkimiseen viittaava määritelmä siis tuntuu periaatteessa oikealta, 
vaikkakin lopullinen tarkkuus riippuu kulttuurin käsitteen ekstensiosta. 
Joka tapauksessa tämän kaltainen määritelmä saattaa kertoa jotain filo- 
logisesta kielikäsityksestä: kieli eri rekistereissään (joista prototyyppinen 
filologia on ollut kiinnostunut etenkin runokielestä) kantaa mukanaan 
sitä käyttänyttä yhteisöä ja kulttuuria. Kielen ja kulttuurin suhde on 
kompleksinen: kieli on samanaikaisesti kulttuurin ilmaus ja osa sitä. 

Historiansa suhteen filologia ei oikeastaan lainkaan kuulu samaan 
sarjaan muiden tässä kirjassa esiteltyjen kielentutkimuksen osa- 
alueiden kanssa. Tämä koskee sekä itse sanan historiaa että filologiak- 
si käsittämämme tieteenalan historiaa: käsitteen tasolla ymmärrettynä 
filologian historia on moninkertaisesti pidempi kuin institutionaalisesti 
ymmärrettynä. Siinä missä vaikkapa nimistöntutkimus ja diskurssianalyysi 
sanoina pyrkivät kuvaamaan sitä, mitä näitä harjoittava tutkija tosiasias- 
sa tekee, filologia tyytyy nimessään ylimalkaisen maalailevaan ”kielen ra- 
kastamiseen”. Tämä ei varsinaisesti kuulosta tieteelliseltä lähtökohdalta, 
vaikka voikin monen filologin tai yleisemminkin kielentutkijan kohdalla 
olla totta: kertoohan se asenteesta, jota voidaan luonnehtia kieltä arvosta- 
vaksi kiinnostukseksi ja pyrkimykseksi sen syvälliseen ymmärtämiseen. 
Ehkäpä tieteenalan nimityksen epätäsmällisyyden vuoksi myös monet 
luonnehdinnat filologiasta ovat merkillisen arvolatautuneita todellisen 
substanssin määrittelyn kustannuksella — näin esimerkiksi toteaa Hans 
Ulrich Gumbrecht (2003, 4): ”philology has cultivated its self-image as 
a patient craft whose key values are sobriety, objectivity, and rationality”. 

Kuten todettua, tunnemme filologian sanana jo antiikista, samoin tie- 
teenalan, vaikkakaan termi ja tarkoite eivät välttämättä langenneetkaan 
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yhteen vielä tuolloin. Länsimaisessa kulttuuripiirissä filologian voidaan 
katsoa saaneen alkunsa Aleksandriassa 200-luvun alkupuolella ennen 
ajanlaskun alkua, kreikkalaisten Ptolemaiosten hallitsemassa Egyptissä." 
Aleksandriaan kerättiin määrätietoisella työllä kreikkalaisen kirjallisuu- 
den kokoelmaa ja luotiin lisäksi tutkimuksen mahdollistava instituutio, 
jota kutsuttiin nimellä Museion. Ensisijaisen kiinnostuksen kohteena 
olivat homeeriset tekstit, joiden mahdollisimman alkuperäiseen ja luo- 
tettavaan muotoon saattamista varten kehittyivät tekstikritiikin mene- 
telmät. Kovin tavaton ei ole väite, jonka mukaan homeerinen runous 
itsessään sisältää eräänlaista filologista tarkastelua, ja että tätä runoutta 
esittäneet ammattimaiset rapsodit eli runonlaulajat arkaaisen kauden 
kreikkalaisessa maailmassa olivat itse asiassa ensimmäisiä filologian 
harjoittajia, koska he olivat perehtyneitä esittämiensä laulujen sisältöön 
ja kieleen ja pystyivät tarvittaessa myös selittämään niitä. Homeerisessa 
runoudessa oli kyse kreikan kielen erityisestä variantista, joka runomi- 
tan suhteellisen tiukkoihin vaatimuksiin mukautuneena ei edustanut 
sinänsä mitään koskaan käytössä ollutta kielimuotoa vaan oli omalakista 
taidekieltä, jossa sekoittui erilaisia elementtejä sekä eri aikakausilta että 
eri puolilta itäistä Välimerta. 


2.2. Status guo 


Suomalaisissa yliopistoissa on vielä vuonna 2020 yllättävän monta 
oppiainetta, joiden nimissä sana filologia on edelleen jäljellä. Tämä 
heijastelee sanan vanhaa ja pitkäaikaista merkitystä ’kieleen kohdistu- 
va tutkimus': esim. englantilainen, espanjalainen, germaaninen, ita- 
lialainen, kreikkalainen, latinalainen, pohjoismainen, ranskalainen ja 
portugalilainen filologia ovat oppiaineiden nimiä — tosin tilanne elää 
jatkuvasti. Joskus törmää termiin uusfilologia (esim. Uusfilologinen 
yhdistys, perustettu v. 1887), joka on luotu aikoinaan klassillisesta filo- 
logiasta erottautumisen vuoksi käsittämään ennen kaikkea muiden 
eurooppalaisten kielten tutkimusta. Fennistisestä filologiasta ei tavalli- 
sesti puhuta (ks. kuitenkin Uusitalo 2019); myös suomalaisen kirjalli- 
suuden tutkimus yliopistolaitoksissamme on paljolti eriytynyt kielen- ja 
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tekstintutkimuksesta. Muiden kielten yliopistollisiin oppiaineisiin kirjal- 
lisuuden tutkimus kuitenkin edelleen Suomessa kuuluu. 

Perinteisissä oppiaineiden ja oppituolien nimissä filologia siis elää. 
Fri asia on, kuinka paljon näiden filologia-aineiden sisällä on tosiasias- 
sa tutkijoita ja opettajia, jotka kuvaisivat omaa työtään filologiseksi. Jo 
vuonna 2000 Fred Karlsson ja Nils Erik Enkvist totesivat seuraavaa: 
”1990-luvun Suomesta saa melkein etsiä vieraiden kielten filologeja 
sanan ahtaimmassa ja perinteisimmässä merkityksessä, siis vanhojen 
tekstien tulkitsijoita”. Sittemmin (2011) Harry Lönnroth on kommentoi- 
nut samaa tilannetta: ”useimmissa suomalaisissa yliopistoissa filologia 
tieteenä ja professiona on enää muisto vain, vaikka moni kielten opiske- 
lija saattaakin vielä kutsua itseään filologiksi erottautuakseen esimerkik- 
si käännöstieteen opiskelijoista”. Filologia-sanan käyttäminen käännös- 
tieteistä erottumisen keinona on yksi tapa ottaa kantaa filologia-sanan 
merkitykseen — joskaan oppiaineiden perinteisissä nimissä, joissa on 
usein korostunut kääntämisen ja tulkkauksen alasta erottautuminen, 
filologia ei kääntämisen vastakohtana ole tarkoittanut pelkästään kielen- 
tutkimusta vaan laajasti ottaen kielen ja kirjallisuuden tutkimusta. 

Filologian historian avulla voidaan ymmärtää, kuinka on tultu tulok- 
seen, jossa sanalle voidaan käytännössä määritellä useita merkityksiä, 
jotka kuitenkin myös risteävät keskenään. Kuva muuttuu lisäksi huo- 
mattavasti, kun tarkastelemme eri kielialueiden tapoja käyttää sanaa: 
esimerkiksi ranskassa philologie ja saksassa Philologie ovat viitanneet 
tekstien editointiin ja tulkintaan, kun taas englanninkielisillä alueilla 
philology on painottunut pikemminkin historiallisten lähteiden kielen 
tutkimukseen (ks. esim. Adamson & Aures-Bennet 2011). Painolastia 
on siis melko tavalla ja väärinymmärrysten riski olemassa. Historial- 
lisen taustan hahmottaminen auttaa kuitenkin ymmärtämään, miksi 
filologiaa ei aina ole helppoa rajata ja määritellä: koska se on toiminut 
kasvualustana monenlaisille humanistisen tutkimuksen osa-alueille, sen 
tieteenalaidentiteettiä ovat usein muovanneet vastakkainasettelut — näin 
on tietysti monilla muillakin aloilla. 

Mitä tulee filologian harjoittamiseen nykyään, tilanne ei kuitenkaan 
ole ehkä aivan niin synkkä kuin edellä siteeratut tutkijat ovat antaneet 
ymmärtää. Filologista tutkimusta tehdään tavalla tai toisella edelleen 
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niissä kotimaisissa yliopistoissa, joissa sitä on aiemminkin harjoitettu, 
joskin oppiainekohtaiset erot ovat varmasti merkittäviä. Viime aikoina 
moni on myös ollut aistivinaan jonkinlaista filologian renessanssia. Ken- 
ties näin onkin: filologian itsereflektio tieteenalana näyttää lisääntyneen. 
Viime vuosina on ilmestynyt useita artikkelikokoelmia, joissa tarkaste- 
lun kohteeksi on nostettu filologian olemus ja relevanssi, esimerkiksi 
The Powers of Philology: Dynamics of Textual Scholarship (Gumbrecht 
2003), Philology and Its Histories (Gurd 2010), World Philology (Pollock, 
Elman & Chang 2015) ja Philology Matters! Essays on the Art of Reading 
Slowly (Lönnroth 2017). Lisäksi Maailmankirjallisuuden filologia on 
juuri suomennettu (Auerbach 2018 [1967]), ja hiljattain on perustet- 
tu uusi aikakauslehti Philological Encounters. Nämä ovat esimerkkejä, 
joissa filologia on sanana nostettu näkyviin, mikä on merkille pantavaa. 
Kielentutkimuksen alojen historiassa käytyjen itsenäistymistaistelujen 
jättämät arvet haalistuvat vääjäämättä. Kielitieteen — jonka voinee sanoa 
tarkastelevan kieltä sen itsensä vuoksi, ei tarkoituksenaan tulkita vanho- 
ja tekstejä — voi katsoa irronneen filologiasta 1800-luvun kuluessa, eikä 
irtautuminen käynyt aivan kivuttomasti. Vastakkainasettelu filologian ja 
kielitieteen välillä onkin aiemmin merkinnyt kuohuvia tunteita, koska 
taustalla on ollut usein ajatuksia tieteiden paremmuusjärjestyksestä. Ny- 
kyään suhteiden ei tarvitse enää olla huonot: samat ihmiset voivat katsoa 
olevansa sekä filologeja että kielitieteilijöitä, ja voi riippua tilanteesta tai 
kysyjästä, sanooko tutkija olevansa filologi vai historiallisen kielitieteen 
harjoittaja. 

Palataan kysymykseen filologian nykytilasta. Esimerkiksi amerikkalai- 
nen sanskritin tutkija Sheldon Pollock on jokseenkin provokatiivisesti 
syyttänyt (2009, 947) filologeja ilmeisesti jostain, mikä on lähinnä huo- 
noa brändäystä: "we have failed spectacularly to conceptualize our own 
disciplinarity”. Samassa yhteydessä Pollock on myös ilmaissut huolensa 
siitä, jääkö filologia ylipäätään eloon: hän havaitsee yleisesti ihmistietei- 
den kentällä mm. teorian liikakasvua (engl. hypertrophy of theory), mikä 
on johtanut havainnoitavan materiaalin syrjäytymiseen tutkimuksen 
ytimestä. Muita hänen mainitsemiaan asioita, joiden kehitystä tulee eri- 
tyisesti seurata, ovat tekstuaalisen suhde oraaliseen ja visuaaliseen (teks- 
tuaalinen uhkaa jäädä jälkimmäisten jalkoihin) sekä vieraiden kielten, 


782 MINNA SEPPÄNEN JA JANNE SKAFFARI 


erityisesti historiallisten, osaaminen, jossa on havaittavissa selvää taan- 
tumaa. Nykytilaan lienee johtanut perinteistä filologiaa teoreettisemmin 
orientoituneen kielentutkimuksen kasvu ja suosio erityisesti 1950-luvun 
lopulta lähtien: teorialähtöinen tulokulma — vaikkapa Noam Chomskyn 
tapaan — oli pitkän aikaa keskeisempi ja tuoreemman tuntuinen kuin 
aineistolähtöinen. Oma vaikutuksensa asiaan ainakin nykykielissä on 
varmaankin ollut myös sillä, että uusimpaan teoriaan tarttuminen on ol- 
lut tutkijan omalle uralle hyväksi — toisin kuin perinteisempi filologinen 
ns. lähiluku, jonka tarkoituksena on avata kieltä ja tekstin tuottanutta 
kulttuuria analyyttisen, täsmällisen ja perusteellisen tarkastelun avulla. 
Toisaalta hyödyllinen lähestymistapa filologisessa metakeskustelussa 
voisi olla niin ikään Pollockin (2009, 934) esittelemä tekstuaalisuuden 
teoria (engl. theory of textuality), jota filologia edustaa siinä, missä ling- 
vistiikka edustaa teoriaa kielestä. Monien filologiksi itsensä mieltävien 
mielestä luonnehdinta filologisesta lähestymistavasta ”dataorientoitu- 
neena”, siinä missä lingvistinen lähestymistapa on ”teoriaorientoitunut” 
(Hogg 1994, 3), vaikuttaa myös osuvalta, mutta on toki huomattava, että 
monia kielitieteen osa-alueita — esimerkiksi korpuslingvistiikkaa — lei- 
maa aineistokeskeisyys tai -lähtöisyys, eivätkä tällaista data vs. teoria 
-kahtiajakoa varmasti monet lingvistit allekirjoittaisikaan. 

Perinteisellä filologialla ei ole ollut tarvetta erityisesti irtisanoutua 
esimerkiksi kirjallisuudentutkimuksesta tai juuri mistään muustakaan; 
filologi on ollut vapaa kysymään tekstiltään relevanteiksi katsomiaan 
kysymyksiä ja tarvittaessa hyödyntämään sekä kielentutkimuksen että 
muiden alojen tutkimuksen menetelmiä ja teorioita. Osa filologeista kat- 
soo tekstiä mahdollisesti vain kielen kannalta, osalle puolestaan tekstin 
näkeminen sanataiteena on olennaista — tosin esimerkiksi genreä kum- 
pikaan ei voi jättää huomioimatta. Olipa tutkimuskysymys mikä tahan- 
sa, filologiseksi tutkimuksen tekee tutkijan asenne tekstin historiassa 
ilmenemistä kohtaan: filologi ei sivuuta kysymyksiä siitä, mikä on teks- 
tin hahmo ja miten siihen on tultu. Mikäli näitä kysymyksiä ei millään 
tavalla pidetä esillä, kysymyksessä ei voine olla filologinen tutkimus. 
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2.3. Tekstin ikä ja menneisyyden rajoitukset 


Filologit voivat tutkia oikeastaan mitä tahansa ilmiötä, joka on jollain 
tavalla läsnä ja havainnoitavissa teksteissä. Joitakin pienimpiä yhteisiä 
nimittäjiä filologiselle tutkimukselle täytynee kuitenkin voida osoittaa. 
Filologian olemukseen on aina kuulunut vanhojen tekstien tulkitsemi- 
nen: alun perin kreikan- ja latinankielisten sekä muilla ns. kuolleilla kie- 
lillä kirjoitettujen tekstien tulkitseminen, sittemmin muilla, uudemmil- 
la kielillä kirjoitettujen. Voidaan kuitenkin aiheellisesti kysyä, onko aina 
mukana oltava jonkinlainen historiallinen komponentti, jotta voimme 
puhua filologiasta. Minkä ikäinen teksti, teos tai fyysinen kirja on his- 
toriallinen tässä mielessä eli riittävän kaukaa menneisyydestä ollakseen 
filologisessa mielessä kiinnostava? Jo vaikkapa kymmenen vuotta van- 
ha teksti on kirjoitettu selkeästi eri ajassa kuin missä me elämme nyt, 
ja ennen internetaikaa tuotetut aineistot on kirjoitettu hyvin erilaiselle 
alustalle kuin merkittävä osa viime vuosien teksteistä. Tässä mielessä 
varsinaista aikarajaa ei oikeastaan ole mahdollista eikä tarpeellistakaan 
asettaa. Tietenkin on hyvin harvinaista, että suhteellisen uusia tekstejä 
tutkiva asemoisi itsensä ensisijaisesti filologiksi. 

Kielikohtaiset erot ovat niin ikään suuria, mitä tulee tekstien ikään; 
esimerkiksi vanhimmat kreikankieliset tekstit ovat reilusti yli 2 000 
vuotta vanhempia kuin vanhimmat suomenkieliset tekstit. Englan- 
nin kieltä on säilynyt 600-luvulta alkaen, vaikka tämä vanhin aineisto 
onkin säilynyt meidän aikoihimme jonkin verran nuoremmissa käsi- 
kirjoituksissa, kuten on myös monissa muissa kielissä. Hieman kar- 
rikoiden voisikin esittää kysymyksen siitä, pitääkö tutkimusaineistos- 
sa olla jokin tekstuaalinen haaste tai epävarmuustekijä, jotta kyse on 
filologiasta. Mahdollisesti kyse on siitä, että filologinen luenta näyttää 
edellyttävän ajallista tai paikallista — sanalla sanoen ehkäpä kulttuurista 
— etäisyyttä sille tarpeellisen hitauden saavuttamiseksi (ks. luku 2.4.). 
Koska filologia tutkii menneisyyden tekstejä, suurimman rajoituksen 
tutkimusaiheiden suhteen muodostaa se, mitä tekstejä meillä ylipää- 
tään on luettavissamme tänä päivänä. Esimerkiksi kielentutkimuksen 
historian tutkimusta rajoittaa huomattavasti se, että vaikka pystymme 
antiikin teoksia lukemalla päättelemään, että stoalainen filosofia vaikutti 
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huomattavasti siihen, millaiseksi kielentutkimus muotoutui, emme vä- 
littömien lähteiden puuttuessa pysty erityisen tarkasti sanomaan, millä 
tavoin se tapahtui. 


2.4. Uusia tuulia 


Tutkimusaiheissa trendit vaihtelevat, ja uusia ilmiöitä nousee pinnal- 
le: esimerkiksi englannin kielen historian tutkimuksessa myöhäisuus- 
englanti (engl. Late Modern English), jota puhuttiin ja kirjoitettiin 
suunnilleen 1700-luvulta 1900-luvun alkuun, on noussut merkittä- 
väksi uudeksi tutkimuskohteeksi vasta viime vuosina. Tähän on syynä 
nykyään jo riittäväksi koettu ajallinen etäisyys esimerkiksi 1800-luvun 
kieleen ja aineistoihin mutta varmasti myös se, että esimerkiksi mui- 
naisenglannin eli noin tuhat vuotta myöhäisuusenglantia vanhemman 
kielimuodon taitajia ei ole tutkimuksia kirjoittamassa tai lukemassa ny- 
kyään lainkaan niin paljon kuin vielä muutama vuosikymmen sitten. 
Eri asia sitten on, pitävätkö tämän myöhemmän kauden tutkijat itseään 
Suomessakaan filologeina — ehkä pikemminkin englannin kielen his- 
toriaan suuntautuneina lingvisteinä tai jonkin tarkemmin määritellyn 
kielitieteen osa-alueen tutkijoina. 

Filologia siis elää ja kehittyy. Vuodesta 1990 lähtien on puhuttu 
uudesta filologiasta (engl. New Philology), sittemmin myös havainnolli- 
semmin materiaalisesta filologiasta. Jälkimmäisen nimityksen käyttämi- 
nen lienee paitsi selkeämpää (myös erotuksena uusfilologiasta, jolla on 
aiemmin viitattu modernien kielten tutkimukseen) myös realistisempaa: 
ei ole tarkoitus implikoida, että ”uusi” olisi jollain tavalla tullut ”vanhan” 
tilalle, eikä ”vanha” myöskään ole vanhentunut; ei ole myöskään katego- 
risesti totta, että ”uusi” olisi jotakin aivan ennen harjoittamatonta. Mistä 
sitten on kysymys? 

Materiaalista filologiaa luonnehtii paluu käsikirjoituksiin pitkän 
editiokeskeisen ja toistaiseksi melko lyhyen korpuspainotteisen aikakau- 
den jälkeen. Asian tarkasteleminen on hyvä aloittaa tekemällä ero käsit- 
teiden teos, teksti ja artefakti välille. Teoksen voidaan ymmärtää olevan 
kirjoittajan intention mukainen sisältö tietyssä kielellisessä muodossa. 
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Teksti puolestaan on yksi teoksen esiintymistä, siis yksi tekstivariantti, 
joka ei kuitenkaan ole itse teos eikä voi täysin vastata alkuperäisen teok- 
sen kirjoittajan pyrkimystä, sillä tekstin sisältö ja muoto muuttuvat, kun 
sitä kopioidaan tai painetaan uudelleen. Artefakti viittaa tekstin mate- 
riaaliseen muotoon: käsikirjoitukseen tai painotuotteeseen, jossa teksti 
on säilynyt. Huomautettakoon kuitenkin, että on tavallista puhua teks- 
tistä laajemmin viitaten ylipäätään jonkin teoksen geneeriseen tekstiin 
yksittäisen esiintymän sijaan, kuten tehdään myös tässä artikkelissa. 
Perinteisen filologisen tarkastelun kohteena on ollut juuri teos, jonka 
hahmosta todistaneet yksittäiset käsikirjoitukset ovat erikseen tai itses- 
sään olleet kiinnostavia vain tiettyyn pisteeseen saakka. Materiaalinen 
filologia sen sijaan on kiinnostunut artefaktitasosta: meille säilyneen 
artefaktin syntymisen sosiaalisesta, kulttuurisesta ja taloudellisesta 
kontekstista ja sen tekemiseen käytetyistä tekniikoista, käsikirjoituk- 
sesta (ja painetusta materiaalista) kokonaisvaltaisesti fyysisenä objek- 
tina kaikkine siihen liittyvine elementteineen (nimiölehdet, prologit ja 
epilogit, marginaalit) sekä tekstin ja artefaktin välisestä suhteesta (teks- 
tin asettelu sivulle, kirjaintyyppi, mahdollinen kuvitus tai otsikointi). 
Kiinnostavaa ei ole (ainoastaan tai ensisijaisesti) se, mikä on kunkin 
tekstin alkuperäinen kielellinen hahmo, vaan kunkin tekstivariantin 
oma yksilöllinen tarina ja sen synty- ja käyttökonteksti. Näin keskeisek- 
si tutkimuskohteeksi nousee alkuperäisen sisällön ja kieliasun sijaan 
tekstin välittyminen tuottajalta kuluttajalle ja sen käyttö. Tekstuaalinen 
varianssi nousee tekstuaalisen auktoriteetin tilalle tai ainakin rinnalle. 
Laajemmin ajateltuna fokuksessa ovat teoksen tuottaneen kulttuurin si- 
jaan tekstin ja artefaktin tuottanut kulttuuri ja kulttuuriset implikaatiot. 


3. Miten filologista tutkimusta tehdään 


Filologian olemusta hahmoteltaessa on ollut suosittua todeta, että sen 
ytimessä on hidas lukeminen. Ajatus tulee Friedrich Nietzscheltä (1844- 
1900), joka muun muassa oli kreikkalaisen filologian professori Baselin 
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yliopistossa, ja edelleen sitä teki tunnetuksi venäläis-amerikkalainen 
kielen- ja kirjallisuudentutkija Roman Jakobson (1896-1982). Tähän 
hitaan lukemisen prosessiin on perinteisesti filologin hyveiksi liitetty 
tietynlainen tulkinnan hienovaraisuus, täsmällisyys ja herkkyys yksi- 
tyiskohdille sekä näiden edellä mainittujen toteutumisen edellytyksenä 
mitä ilmeisimmin kärsivällisyys. Nämä eivät ehkä ole tyydyttäviä ohjeita 
esimerkiksi tutkielmansa metodologiaan liittyvää ohjausta kaipaavalle 
opiskelijalle, mutta ne ovat yhtä kaikki realistisia huomioita tutkimuk- 
sen tekemisen luonteesta. Tässä luvussa tarkastelemme lähemmin 
filologisen tutkimuksen metodologiaa. Lähestymme aihetta useista eri 
näkökulmista: funktionaalisesti tieteenalan sisältä, sen lähialojen kan- 
nalta sekä tutkimuskysymysten ja ammatti-identiteettien kannalta. 


3.1. Monimuotoinen lähestymistapa 


Filologiasta on luontevaa puhua tieteellisenä lähestymistapana tai näkö- 
kulmana; filologisilla metodeilla puolestaan täsmällisesti ottaen ym- 
märretään ennen kaikkea kriittisten tekstieditioiden valmistamisen 
periaatteita. Kyse on metodeista, joita filologin on tarkoituksenmukais- 
ta ymmärtää sitä paremmin, mitä vanhempia ja käytetympiä tekstejä 
hän tutkii, vaikka ei itse päätyisikään tekemään tieteellistä editiota. 
Filologinen orientaatio on periaatteessa hyvin käytännöllinen: pyrki- 
myksenä on tekstin ymmärtäminen mahdollisimman hyvin. Erilaisia 
teoreettisia viitekehyksiä on mahdollista hyödyntää sen mukaan, mikä 
on tarpeellista. Filologit ovat toimineet näin esimerkiksi pragmatiikan, 
sukupuolentutkimuksen, kielihistorian ja kirjallisuusteorioiden kans- 
sa. Wegmann (2014, 27) puhuukin mitä moninaisimpia yhdistelmiä 
suvaitsevasta polymorfisuudesta suorastaan filologian tavaramerkkinä. 
Toisinaan ei ole edes erityisen selvää, missä teoreettisten viitekehysten 
tai lähestymistapojen rajat kulkevat. Esimerkiksi filologian ja uuden là- 
hialan läheisyydestä käy historiallinen sosiolingvistiikka, jonka kenttää 
Journal of Historical Sociolinguistics kuvailee verkkosivuillaan seuraavasti: 
”aspects of language and society in the past including (but not limited 
to) the social embedding of language variation and change, issues of 
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language contact and conflict, historical multilingualism, the social 
stratification of writing skills, the development of language norms and 
the impact of language ideologies”. Näissä fokuksissa ei ole välttämättä 
sinänsä mitään vierasta sellaisillekaan filologeille, jotka eivät erityisesti 
identifioidu sosiolingvisteiksi. Provokatiivisesti voisikin kysyä, voiko täl- 
laista tutkimusta tehdä ilman filologista ymmärrystä tekstien ja konteks- 
tien luonteesta. Sosiolingvistiikan ohella merkityksiä konteksteissaan 
tutkivaa pragmatiikkaa voidaan yhdistää filologian kanssa hyödylliseksi 
lähestymistavaksi (Mäkilähde 2019). 

Esimerkkinä materiaalisen filologian yhdistämisestä kielitieteeseen, 
erityisesti pragmatiikkaan, voidaan tarkastella vaikkapa hiljattain esitet- 
tyä neliportaista menetelmää, jota voi soveltaa monenlaisiin samaa teos- 
ta heijasteleviin teksteihin. Menetelmän kehittajilla (Carroll, Peikola, 
Salmi, Varila, Skaffari & Hiltunen 2013) aineistona on Polychronicon, 
suosittu keskiaikainen latinankielinen maailmanhistoria, joka on säi- 
lynyt Euroopassa yli sadassa käsikirjoituksessa. Englanniksi historian 
käänsi John Trevisa 1300-luvun lopulla. Menetelmässä lähdetään liik- 
keelle yhden teoksen eri tekstivarianttien (tekstien) tunnistamises- 
ta editioiden ja muun lähdemateriaalin avulla; esimerkiksi Trevisan 
Polychronicon-käännöksiä eli tekstivariantteja on olemassa neljätoista. 
Sitten edetään kunkin tekstin materiaaliseen kuvaukseen, jossa tarvitaan 
alkuperäisiä tai digitoituja käsikirjoituksia sekä muun muassa paleo- 
grafian eli vanhojen käsialojen tutkimuksen taitoja. Seuraavaksi eri teks- 
tien materiaalisia kuvauksia vertaillaan keskenään: millaisille alustoille 
eri tekstit on kirjoitettu, mitä kirjaintyyppiä eri kirjurit ovat käyttäneet, 
miten teksti on jaettu riveille ja sivuille, onko käsikirjoituksessa kuvi- 
tusta, miten tekstin eri osat on nimetty tai numeroitu jne. Viimeisessä 
vaiheessa tekstien kielellisiä ja visuaalis-materiaalisia eroja selitetään 
pragmatiikan käsitteiden avulla tekstin (engl. textual), vuorovaikutuk- 
sen (engl. interactional) ja asenteen (engl. stance) tasolla, mikä tuottaa 
tarkemman analyysin aineistosta kuin pelkästään kieleen keskittyvä 
pragmatiikka tai materiaaliorientoituneet kodikologian? tai paleografian 
alat yksinään. Yleisemmin materiaalinen filologia antaa kielentutkijalle 
tarpeellista kontekstuaalista tietoa erityisesti silloin, kun tekstin tuottaja 
ja vastaanottaja ovat jääneet anonyymeiksi tai heistä ei ole muuta tietoa 
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kuin nimi. Esimerkiksi kirjan koko, tekstin asettelu sen lehdille seka 
se, mitä tekstejä siihen on sidottu ja miten käsikirjoitus on kuvitettu 
tai koristeltu (tai ei ole), kertovat (fyysisen) kirjan käyttötarkoituksesta, 
tekijästä ja lukijasta, jotka kaikki heijastuvat myös sen kieliasuun. 


3.2. Tekstikritiikki ja editiotyypit 


Kuten totesimme, filologisen tutkimuksen pyrkimyksenä on tekstin 
mahdollisimman syvällinen ymmärtäminen. Tätä ymmärrystä voidaan 
sitten soveltaa muihin tutkimuksen tavoitteisiin, jotka voivat liittyä 
kielen-, kirjallisuuden- tai kulttuurintutkimukseen. Tekstin ymmärrys- 
tä symboloi ja myös käytännössä edustaa kriittinen editio. Se on teksti, 
jonka tulee perustua olemassa olevien käsikirjoitusten perinpohjaiseen 
tuntemukseen. Kriittinen editio muodostuu tietynlaisen prosessin, 
tekstikritiikin, tuloksena. Tällä tarkoitetaan tieteellistä menetelmää, joka 
pyrkii selvittämään tekstin alkuperäisimmän mahdollisen muodon ver- 
tailemalla siitä säilyneitä — mahdollisesti kovinkin erilaisia — versioita 
ja rekonstruoimalla niiden perusteella sellaisen tekstimuodon, jonka 
voi perustellusti arvioida vastaavan alkuperäisen kirjoittajan intentio- 
ta. Kriittinen editio sisältää tekstin lisäksi ns. kriittisen apparaatin (lat. 
apparatus criticus) eli varsinaiseen tekstiin liittyvän erillisen osion, jossa 
erilaiset tekstin lukutavat ja käsikirjoitustraditioon liittyvät merkinnät 
sijaitsevat. Kriittisessä editiossa sekä teksti että kriittinen apparaatti pe- 
rustuvat relevanttien käsikirjoitusten tai painosten ja mahdollisten edel- 
tävien kriittisten editioiden konsultoimiseen. 

Siinä missä kriittinen editio voi olla erinomainen lähde historioitsijal- 
le tai muulle ennen kaikkea teoksen sisällöstä kiinnostuneelle, se ei auta 
vaikkapa morfologista vaihtelua tutkivaa, joka tarvitsee mahdollisimman 
autenttisen aineiston, jota ediittori ei ole muuttanut. Tällöin nousee tar- 
peelliseksi diplomaattinen editio, jolla tarkoitetaan sellaista tieteellistä 
editiota, jonka tarkoituksena on esittää käsikirjoitus tai painettu teksti 
mahdollisimman uskollisesti alkuperäiselle fyysiselle tekstille. Tällöin 
ediittori ei pyri yhdenmukaistamaan kielellisiä muotoja tai kirjoittajan 
käytänteitä (kuten välimerkkejä) vaan välittämään luotettavan kuvan 
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Kuva 1. Polychronicon-kásikirjoituksen sivu: Manchester, Chetham's Library MS 
Mun A.6.90, f. 126r. Kuvaan lisättyjen nuolien välissä on edition tekstikohta 
(kuva 2). Julkaistu kirjaston luvalla: Chetham's Library, Manchester. 


yhdestä tekstistä. Sen tarkoitus ei siis ole rekonstruoida taustalla hää- 
möttävää teosta vaan dokumentoida yhtä tekstivarianttia. Nykyään tut- 
kijan aineistona voi olla myös digitaalisia kuvia, jotka kirjaimellisesti 
antavat vielä tarkemman kuvan tutkittavasta materiaalista kuin editio 
tai faksimile. Sivu sivulta valokuvattu käsikirjoitus, joka on nähtävillä 
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Chapter 1 


Hys queene Ethelswida bare hym twy sones, Edward pe Eldere & Egelward, 
35 & pre dogters, Elfleda, Lady of Mercia, Ethelgora, a meynchen, & Elfrida; and 
he made ham alle lurne gramer & oper vre artes & scyens. 
Panne Aluredus, 3euer of almus & hirer of masses, souzte bysylyche lore of 
art & of craftes pat he knew nozt, & sent vor Seynt Grymbald pe monk, a 
kunnynge man of lettur & of songe, & prayde hym yor to come to hym out of 
40 Frauns into Englond. Also he sente vor John, monk of Seynt Dauy hys abbay in 
Meneuia, vor he scholde come to hym out of pe ottemeste endes of Wales vor to 
teche hym lettur & clergy. He excytede & comfortede pe lordes of hys lond to 
lurne lettur & clergi, so pat hy scholde sette here childern to scole; and 3ef hy 
hadde no chyldern hy scholde graunte here bondemen vredom & sette ham to 
45 scole, 3ef hy hadde good wyt & were habel to lerne. He enquirede & aspyede 
bysylyche pe doynge & dedes of hys offysers & seruauntes & namlyche of 
iuges & of domesmen and 3ef he knew pat eny of ham errede & dude amys, 
wheper hyt [were] vor vnkunnyng oper vor couetys, a pot hym out of offys. 
Also he made Warefredus, byschop of Wirceter, translate & torne into Saxon 
50 speche Gregory hys bokes Dialogorum. 
Willelmus, de Regibus, libro primo. He delede a pre al pat he myzte spende; 
& 3ut he delede pe vurste del a pre. Pe vurste del parof he delede to pe kyng 


35 Elfrida] alfrid... R; and] om. LJ. 36he] om. R; vre] pre F. 37 almus] almys dede 
R; &]om. K. 38oflom.F; he]h..R; vor] after HBK; Grymbald] Grymbaldus 
J, Grymbad R. 39 lettur] lettrure STMHBALREIP; prayde] prayere R; to hym] 
om. T. 40Dauy hys] Dauipis HB, dauid K. 4! vor ... scholde] to K; to hym] om. T; 
pe ... of] om. HBK; ottemeste] outremest TJ; endes] ende J; vorto] to K; forhe 
shulde B. 42 lettur &] om. K; lettur] lettrure STMHBALFJP; He... (43) clergi] om. 
J; lordes] lorres R. 43 lettur] lettrure STMHBALFP, letturs R. — 47 knew] myght 
vnderstande K; pat] om. MHBALRFJP; eny of ham] they K; &(2)] or TK. 
48 were] STMHBKALRFIP, om. C; hym] them KL; of] of his STMHBALREJP. 
49 Warefredus] Wiresredus S, Wilfredus T; translate] translated FJP; & torne] om. 
K; torne]torned P; Saxon] saxouns R. 50 Dialogorum] dialogore MALR, dialogre 
FP, dialogie J, dyalogus K, diagolore T. 51 delede (1)] departed K (also 52 (1), 62, 
86). 52 pe (1) ... 63) ydeled] om. J; pe(1)..delede] om. FP; del(1)] part K, 3eer 
STALR: Pe...(59) partyes (1)] om. K. - k 
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Kuva 2. Polychronicon-edition sivu. Lontoon British Libraryssä olevan käsikirjoi- 
tuksen (Cotton Tiberius D.VII) teksti on sivun yläosassa. Keskellä näkyy kriitti- 
nen apparaatti, jossa mainitaan muissa käsikirjoituksissa esiintyvät variantit; 
Manchesterin käsikirjoituksen (kuva 1) lyhenne on M. Alimpana on latinan- 
kielinen lähtöteksti. Julkaistu kustantajan luvalla: Ronald Waldron (toim.). 2004. 
John Trevisa's Translation of the Polychronicon of Ranulph Higden, Book VI. [Middle 
English Texts, vol. 35]. Heidelberg: Universitätsverlag Winter, 3. 
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esimerkiksi jonkin kirjaston verkkosivuilla, ei kuitenkaan itsessään ole 
editio vaan kokoelma digitaalisia kuvia ilman lähdekirjallisuutta ja filo- 
login panosta. Editiot puolestaan ovat sekä toimittajansa tutkimuksen 
tuloksia että tutkimusaineistoja käyttäjilleen. 


3.3. Kuka on filologi? 


Tutkimuksen tekemisen tapaa voi tarkastella myös ammatti-identiteettien 
kautta. Filologisen koulutuksen saaneiden ammatti-identiteetti vaihtelee: 
esimerkiksi klassillisen filologian parissa osa mieltää itsensä kielitieteili- 
jöiksi, osa identifioituu yleisesti antiikintutkijoiksi ja eräille tarkempi eri- 
koistumisala, vaikkapa papyrologia, on ensisijainen ammatti-identiteetin 
lähde. Nykykielten filologit ovat — ainakin Suomessa — usein koulutuk- 
seltaan pikemminkin kielitieteilijöitä kuin kirjallisuuden- tai kulttuurin- 
tutkijoita, vaikka filologia-aineiden opetussuunnitelmiin tyypillisesti 
kuuluukin myös kirjallisuusopintoja ja kohdekielen kannalta relevant- 
teihin kulttuureihin ja historiaan tutustumista. Moni filologi varmasti 
identifioituu tietyn kielen tutkijaksi, ei niinkään yleislingvistiksi. Myös 
materiaalisen filologian tutkijalla saattaa olla lingvistinen koulutus, mutta 
hänen työnsä keskiössä voi silti olla tekstin kielellisten piirteiden sijaan 
vaikkapa kirjoitusalusta, käsiala tai kirjaintyyppi. Hän toimii siis myös 
kodikologian ja paleografian aloilla tai käyttää niiden menetelmiä. Ma- 
teriaalinen filologi voi siis huomioida tutkimansa tekstin ohella muut 
samaan käsikirjoituskirjaan sidotut tekstit ja niiden yhteydet varsinai- 
seen tutkimuskohteeseen tai tarkastella esimerkiksi taivutusmorfologisen 
vaihtelun sijaan tai lisäksi kirjainmerkkien muodoissa esiintyvää variaa- 
tiota. Kodikologiasta, paleografiasta ja tekstikritiikistä voidaan puhua ns. 
tekstuaalitieteinä (engl. textual scholarship) samoin kuin muista tekstien 
kirjoittamista, variaatiota ja välittymistä tutkivista tieteistä, joiden intressit 
tulevat usein varsin lähelle filologisia intressejä. 

Metodologisesti pelkkä filologia ei välttämättä kuvaakaan erityisen 
tarkasti monenkaan tutkijan tekemisen tapaa, minkä vuoksi alojen ni- 
mitykset ja ammatti-identiteetit ovat jatkuvan keskustelun ja uudelleen- 
määrittelyn kohteena: kuten Wegmann (2014, 27) toteaa, tieteenalan 
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itseymmärryksestä on tullut pluralistista. Yleisesti identiteettien suhteen 
täytyy todeta myös, että lukkiutuminen ja raja-aitojen rakentelu eivät ole 
tätä päivää; tutkijan on mahdollista ja tarpeellistakin omaksua uransa ai- 
kana monia erilaisia identiteettejä. Monille kielentutkimuksen ammatti- 
laisille keskeisin identiteetti on, kuten sanottu, kuitenkin sidoksissa eri- 
koistumiskieleen, vaikka esimerkiksi germanisteista ja romanisteista 
kuuleekin syystä tai toisesta puhuttavan yhä vähemmän. 

Filologisella otteella tutkimusta tekevän pitää luonnollisesti tuntea 
tutkimansa kielimuoto hyvin. Nykykielten oppiaineissa on vaihtelevasti 
tarjolla kielten varhaisvaiheiden opetusta, mutta peruskurssien jälkeen 
kielimuotoa voi opiskella myös itsenäisesti, ja sanaston ja kieliopin tun- 
temus joka tapauksessa karttuu tutkimusta tehdessä. Kielitaitoon liit- 
tyy myös oman alan perustyökalujen eli (historiallisten) sanakirjojen 
ja kielioppien käyttö. Latinan ja muinaiskreikan osalta voidaan sanoa, 
että opetus yleensä keskittyy klassisimman vaiheen kielimuotoon; ajal- 
liset, paikalliset ja genreen liittyvät erityispiirteet muodostavat haasteen 
näissäkin kielissä. Tekstien ”hidas lukeminen” edellyttää kielimuodon 
hallinnan lisäksi myös tutkittavan kauden historian ja kulttuurin tun- 
temusta, jotta anakronismeilta (eli karkeimmillaan ilmiöiden sijoitta- 
miselta väärään historialliseen aikakauteen) voidaan välttyä. Tekstien 
kirjoittajiin ja vastaanottajiin on tarpeellista tutustua mahdollisimman 
hyvin, samoin on tunnettava heidän kulttuurinen viitekehyksensä, joka 
vaikuttaa muun muassa intertekstuaalisuuteen eli siihen, miten eri teks- 
tien välille rakennetaan yhteyksiä esimerkiksi sitaateilla ja alluusioilla. 
Filologia on kontekstualisoivaa lukemista, eikä kontekstiin tutustumi- 
nen käy hetkessä vaan edellyttää usein pidempää paneutumista opin- 
tojen aikana. Lisäksi on mainittava, että yksittäisen tekstin kontekstiin 
eivät kuulu ainoastaan siihen liittyvät meille säilyneet tekstit vaan tyy- 
pillisesti myös suuri joukko jossain kohtaa traditiota vaikuttaneita teks- 
tejä, jotka ovat peruuttamattomasti kadonneet. Tämä kaikki on sellaista, 
mikä filologin on kyettävä jollain tavalla ottamaan huomioon. Tiivistäen 
voidaan sanoa, että filologinen havainnointi perustuu mahdollisimman 
syvälliseen ymmärrykseen siitä, millaisissa oloissa käsiteltävänä oleva 
teksti on syntynyt. 
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3.4. Filologin materiaali 


Käytännössä filologista tutkimusta tehdään sekä suoraan alkuperäis- 
aineistoon perustuen (esim. papyrusmateriaali, piirtokirjoitukset, 
eri-ikäiset käsikirjoitukset, painettu materiaali) että kriittiseen (tai dip- 
lomaattiseen) editioon perustuen. Riippuu suuresti aikakaudesta ja 
kulttuuripiiristä, missä määrin, millaisia ja minkä tyyppisiä editioita on 
saatavana. Voidaan sanoa, että esimerkiksi klassillisen filologian piiris- 
sä homeerisia tekstejä on editoitu kunkin ajan parhaiden tieteellisten 
käytäntöjen mukaan jo 200-luvun alkupuolelta eaa. Keskiaikaisten käsi- 
kirjoitusten välityksellä meille periytyneet antiikin ajan tekstit onkin jo 
kaikki ainakin kertaalleen editoitu, mutta esimerkiksi bysanttilaisten 
skholia-tekstien (eli varsinaista, tyypillisesti antiikista peräisin olevaa 
tekstiä kommentoivien reunatekstien) ensieditioita ilmestyy edelleen 
säännöllisesti. Ottaaksemme esimerkin kotimaasta voimme todeta, että 
Aleksis Kiven teosten kriittisten editioiden julkaiseminen alkoi vuonna 
2010 ja on tätä kirjoitettaessa vielä kesken. 

Filologiselle tutkimukselle on ollut leimallista, että tutkimustradition 
alkuvaiheissa tärkeäksi on noussut erityisesti kaunokirjallisuuden ja yli- 
päätään kansallisromanttisten ideologioiden valossa merkittävien teks- 
tien tutkimus. Myöhemmin on tullut tilaa myös arkisempien tekstilajien, 
kuten kirjeiden ja erilaisten asiakirjojen, tutkimukselle. Esimerkiksi voi 
nostaa vaikkapa Raija Sarasti-Wileniuksen edition Dear Brother, Gracious 
Maecenas: Latin Letters of the Gyldenstolpe Brothers (1661-1668). Mitä tulee 
ruotsinkielisiin teksteihin, suuri osa keskiaikaisesta materiaalista on jo 
kertaalleen editoitu; viimeaikaisista editioista voidaankin mainita Evert 
Meleforsin Senmedeltida kopparutvinning i Ätvidaberg speglad i räkenskaper 
fran 1500-talets början (2013), joka edustaa juuri sellaista materiaalia (tili- 
kirjoja), jonka editointia ei ole koettu ensisijaiseksi, sekä uudelleen editoi- 
tavat Pyhän Birgitan ilmestykset (toim. Roger Andersson, vuodesta 2014 
lähtien). Editoinnissa on nykyään myös vahva digitaalinen ulottuvuus, mitä 
kuvastaa esimerkiksi Ville Marttilan väitöskirja: Creating Digital Editions for 
Corpus Linguistics: The case of Potage Dyvers, a family of six Middle English 
recipe collections (2014) on korpuslingvistisesti suuntautunut dokumentaa- 
rinen editio keskiajan lopun kansankielisistä ruokaresepteistä. 
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Filologista lähestymistapaa voi pitää soveltuvana kaikkeen menneisyy- 
destä meille säilyneeseen tekstiin. Koska on kysymys tekstistä ja men- 
neisyydestä — vaikka ei välttämättä kaukaisestakaan —, voidaan sanoa, 
että aineisto määrää filologin mahdollisuuksia tutkia enemmän kuin 
monen muun lähestymistavan edustajan. Aivan kaikkien ilmiöiden tut- 
kiminen ei ole mahdollista kaikkien aikakausien osalta lähdemateriaalin 
puuttumisen vuoksi. Klassillisen filologian kohdalla aineisto on ollut 
viimeisen vuosisadan ajan suhteellisen vakiintunutta. Jonkin verran saa- 
daan toki vuosittain tutkittavaksi ennennäkemätöntä kirjallista mate- 
riaalia suoraan antiikista, siis ilman keskiaikaisia välikäsiä eli käsikirjoi- 
tuksia. Esimerkiksi kesällä 2017 raportoitiin Pohjois-Englannista jälleen 
uusista tekstilöydöistä, ns. Vindolandan tableteista eli kirjoitustauluis- 
ta, jotka ovat peräisin ensimmäiseltä vuosisadalta jälkeen ajanlaskun 
alun. Myös yksittäisten auktorien eli kirjoittajien korpus elää: vaikka 
esimerkiksi antiikista peräisin olevia uusia kaunokirjallisia tekstikoko- 
naisuuksia tuskin enää löytyy, voi attribuutioihin tulla tarkennuksia 
mm. tietokoneilla toteutettavan laajoihin korpusanalyyseihin perustuvan 
tutkimuksen avulla. Edes Shakespearen tuotanto ei ole muuttumaton: 
esimerkiksi vuonna 2016 vahvistettiin Henrik VI -näytelmät William 
Shakespearen ja Christopher Marlowen yhdessä kirjoittamiksi. 


3.5. Digitalisaatio ja aineistot 


Filologien tutkimusmahdollisuudet paranevat ja helpottuvat suures- 
ti digitaalisten ympäristöjen kehittymisen myötä, kun käyttöön tulee 
laajoja korpuksia, digitoituja aineistoja ja kaikkien hyödynnettävissä 
olevia tietokantoja. Tutkimusaineistojen kattavuus tietenkin vaihtelee 
kielittäin, samoin maksullisten korpusten ja korpusohjelmien saatavuus 
yliopistoittain. Klassillisen filologian parissa on perinteisesti oltu digita- 
lisaation suhteen hyvin ajan hermolla. Esimerkiksi Thesaurus Linguae 
Graecae (TLG) on jo vuonna 1972 perustettu projekti, joka nykymuotoi- 
sena käsittää valtaosan kaikista kreikankielisistä teksteistä homeerisista 
teksteistä vuoteen 1453 saakka. Historiansa aikana TLG on ehtinyt olla 
saatavana magneettinauhoilla, CD-romilla ja vuodesta 2001 verkossa. 
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Painetun kirjan varhaisesta historiasta kiinnostuneelle anglistille puo- 
lestaan Early English Books Online (EEBO) on äärimmäisen arvokas 
aineistolähde. Se sisältää kuvia kutakuinkin kaikkien englanniksi pai- 
nettujen kirjojen sivuista uuden ajan alusta (1473-1700), ja siinä on 
materiaalia myös muilla kielillä. Kielellisten ilmiöiden laaja-alaisempi 
tutkiminen yli 17 miljoonan kuvan kokoelmasta on kuitenkin vaikeaa, 
jos haut voivat kohdistua vain nimekkeeseen, kirjoittajaan, asiasanoihin, 
painovuoteen tai muuhun vastaavaan. Niinpä tätä aineistoa täydentää 
EEBO-TCP (Text Creation Partnership), joka tuottaa EEBOn kirjojen 
transkriptioita muun muassa kielentutkijoiden (korpus)aineistoksi so- 
pivina xml-dokumentteina. 

Ylipäätään voidaan sanoa, että korpuslingvistiikan kehittymisen myö- 
tä yleistyneet kvantitatiiviset eli määrälliset menetelmät heijastuvat myös 
filologiseen tutkimukseen. Pienten aineistojen hidas lukeminen saattaa 
vaikuttaa jäävän suurten aineistojen nopean, tietokoneavusteisen mää- 
rällisen analyysin jalkoihin, vaikka kontekstiin paneutuminen olisi tar- 
peen monessa tutkimuksessa — mitä suurempi korpus, sitä vähemmän 
on tietoa yksittäisten tekstien taustoista tai kielenkäyttökonteksteista. 

Kvalitatiivisella eli laadullisella sekä pienempien aineistojen tutki- 
muksella on edelleen paikkansa, ja siinäkin digitalisaatio auttaa tutkijaa. 
Luvussa 3.1. mainittua Polychronicon-tutkimusta ei olisi voinut toteuttaa 
eikä siinä esiteltyä menetelmää testata, ellei eri käsikirjoitusten sivuis- 
ta olisi ollut saatavilla digitaalisia kuvia, sillä tutkitut käsikirjoitukset 
sijaitsivat seitsemässä eri kaupungissa Britanniassa ja Yhdysvalloissa. 
Alkuperäisaineiston tutkiminen paikan päällä on materiaaliselle filo- 
logille ihanteellinen tilanne, mutta se on usein niin hankalaa tai kallista, 
että riittävän tarkka kuva-aineisto on käytännöllisempi valinta tutkimuk- 
sen perustaksi. Digitoidut aineistot voivat sekä mahdollistaa muuten 
vaikeasti toteutettavan tutkimuksen että sulkea pois sellaisia tutkimus- 
kysymyksiä, joiden vastaamiseen digitaalinen editio tai kuvamateriaali 
ei riitä. 
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4. Yhteenveto 


Olemme siteeranneet yllä useita tuoreita julkaisuja sekä Suomesta että 
ulkomailta. Jo näiden kirjojen ja artikkelien olemassaolo osoittaa, että 
filologia ei ole tieteellisenä lähestymistapana häviämässä. Voitaneen 
puhua pikemminkin vahvistumisesta — tai sitten on alettu tunnistaa 
uudempien menetelmien juuret, niiden velka perinteiselle tekstin- 
tuntemukselle. Yksittäisten tekstien tai tekstistöjen tutkimusta ja syväl- 
listä tuntemusta tarvitaan vastapainoksi tai täydentäjäksi usein kvantita- 
tiiviselle korpustutkimukselle. 

Filologisen tutkimuksen yhteenniputtaminen ei ole aivan yksinker- 
taista. Tutkimuskohdetta tai -kysymyksiä ei näytä olevan tarpeellista 
nostaa esille tutkimuksen yhteisiä nimittäjiä haettaessa; filologi säilyttä- 
köön vapautensa kiinnostua kaikentyyppisistä ilmiöistä, joihin tekstin 
tutkiminen voi tuoda valaistusta. Monelle tutkijalle Suomessa nämä 
ovat epäilemättä kielen ilmiöitä: menneisyyteen keskittyvää synkronista 
kielentutkimusta voidaan tehdä filologisella otteella. 

Mikä sitten on filologiseksi identifioituvan tutkimuksen kannalta 
tärkeää? Esiin nousevat ensisijaisesti aineistolähtöisyys ja menetelmät. 
Kontekstien tuntemus ja huomioonottaminen — se, että tekstin mitään 
osaa ei lueta irrallisena — merkitsevät tutkimuksen lopputuloksen kan- 
nalta sitä, että tutkijan tulkinta ei muodostu anakronistiseksi. Riippu- 
matta tutkimusaineistosta ja sen kielestä filologisen tutkimuksen teh- 
tävänä on yhä uusien sukupolvien voimin tarkastella menneisyyden 


tekstejä ja kysyä niiltä omasta ajasta kumpuavia relevantteja kysymyksiä. 
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VIITTEET 


1 Kreikkalaisten harjoittamaa filologiaa vielä jonkin verran varhaisempaa oli Intiassa 
harjoitettu pyhien tekstien tulkinta. Ns. prötos heurétés (ensimmäinen keksijä”) -kisan 
voittajaa ei ole ehkä kuitenkaan mahdollista ratkaista kovin täsmällisesti. 

2 Kodikologia on laveimmassa merkityksessään koodeksien eli lähinnä keskiajalta ja 
uuden ajan alusta säilyneiden fyysisten kirjojen sekä niiden historian tutkimusta. 

3 Faksimile on painotuotteen tai käsikirjoituksen valokuvajäljennös. Painetut faksimilet 
ovat jo jääneet digitoitujen aineistojen varjoon. 

4 Attribuutiolla tarkoitetaan teoksen määrittämistä jonkun tietyn auktorin laatimaksi. 
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Mikä? 

Nimistöntutkimus eli onomastiikka tarkastelee erisnimiä monista eri 
näkökulmista. Nimiä voidaan tutkia osana kielijärjestelmää mutta myös 
omana systeeminään, joka toimii vuorovaikutuksessa ympäristön kans- 
sa. Tästä syystä nimistöntutkimus kaipaa usein myös joltain muulta 
tieteenalalta, esimerkiksi historiasta, maantieteestä tai sosiaalipsyko- 
logiasta, saatavaa taustatietoa. Nimistöntutkimuksessa voidaan hyödyn- 
tää monia eri kielitieteen tutkimusmenetelmiä sen mukaan, minkä nimi- 
kategorian nimiä tutkitaan, mitä niistä halutaan selvittää ja millaiseen 


teoreettiseen taustaan tukeudutaan. 


Katso myös: 
Johdannon luku 1. Tutkimuksen käytäntö 
Johdannon luku 4. Kielitieteen etiikka — hyvä tutkimus murroksessa 


Luku 1 Kielitaju kielentutkijan työkaluna 
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Luku 2 Kysely 

Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 
Luku 5 Lingvistinen etnografia toimintayhteisöissä 

Luku 6 Diskurssianalyysi 

Luku 7 Laadullinen aineistopohjainen kielentutkimus 

Luku 20 Tekstintutkimus 

Luku 21 Sosiolingvistiikka 


Luku 24 Psyko- ja neurolingvistiikka 


1. Johdanto 


Nimistöntutkimuksen eli onomastiikan tarkastelun kohteena ovat eris- 
nimet eli proprit. Onomastiikka on siis eri asia kuin onomasiologia, joka 
tarkoittaa tietyn käsitteen tai käsitepiirin nimitysten tutkimusta (Tieteen 
termipankki sv. onomasiologia). Onomasiologisen tutkimuksen koh- 
teena ovat tavallisesti kielen yleisnimet eli appellatiivit, esimerkiksi eri 
maantieteellisiä käsitteitä tarkoittavien nimitysten kehittyminen (Laine 
2007). Onomastiikkaakin voi toki harjoittaa onomasiologisesta näkö- 
kulmasta: on muun muassa tutkittu, millaisia nimimalleja 1800-luvulla 
syntyneelle kaupalliselle yritystoiminnalle kehittyi (Sjöblom 2006, 92). 
Pohjimmiltaan onomastiikka on lingvististä tutkimusta, mutta tutki- 
muskohde ja tutkimuskysymykset vaativat usein moni- tai poikkitieteellistä 
lähestymistä. Onomastiikan juuret työntyvätkin tieteidenväliseen maas- 
toon, sillä alun perin nimiä ryhdyttiin tarkemmin tutkimaan menneisyy- 
den tutkimuksen arkeologian apuna. Vanhat paikannimet näet paljastavat 
yhtä ja toista ajoista, joista ei ole olemassa kirjallisia dokumentteja. 
Nimistöntutkimus on vanhastaan jaoteltu henkilönnimitutki- 
mukseen eli antroponomastiikkaan ja paikannimitutkimukseen eli 
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toponomastiikkaan. Viime vuosituhannen loppupuolelta tähän asti jaot- 
teluun on ollut tapana lisätä kolmanneksi muiden nimien tutkimus, 
johon sisältyy hyvin erilaisia tutkimuskohteita eläinten nimistä yritysten 
nimiin tai kaunokirjallisuudessa esiintyvistä nimistä laivojen nimiin. 
Tällainen jaottelu perustuu nimikategorioihin, eli tällöin tutkimusta 
määrittää pääasiassa se, minkä lajin tarkoitteeseen nimi viittaa, eikä 
esimerkiksi tutkittavien nimien käyttökonteksti. 

Tässä teoksessa onomastiikan metodeja ei esitellä nimikatego- 
rioittain, sillä yhteen ja samaan nimikategoriaan kuuluvia propreja on 
mahdollista tutkia monista eri näkökulmista ja monin eri menetelmin. 
Tarkoituksenamme on kuvata eri analyysitapoja, joista voi valita omaan 
tutkimuskohteeseensa ja tutkimusongelmaansa parhaiten soveltuvan 
metodin tai metodien yhdistelmän. 

Luku 2 on yleiskatsaus proprien asemaan kielessä sekä nimistöntutki- 
muksen taustateorioihin. Luvussa 3 esittelemme eri luvuissa yleisimmät 
onomastiikassa käytössä olevat analyysimallit, ja luvun 4 yhteenvedossa 
kokoamme päälinjat ja luomme silmäyksen onomastiikan tulevaisuu- 
den mahdollisuuksiin. 


Mihin? 


Onomastiikan tutkimuskohteena ovat kielen sanat, joilla viitataan vain 
yhteen tarkoitteeseen. Nimen perustehtävänä on identifioida entiteetti 
muista samankaltaisista. Nimien tarkoitteita voivat olla todelliset tai ku- 
vitteelliset henkilöt, paikat, eläimet, ihmisen rakentamat tai tuottamat 
esineet ja asiat. Nimistöntutkimuksen avulla voidaan saada tietoa niin 
asutushistoriasta, identiteettien rakentumisesta, ihmisen ajattelusta, ar- 
vostuksista ja sosiaalisista suhteista kuin myös kielisysteemistä. 
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2. Tutkimuksen lähtökohtia 


Sanaluokkana erisnimet kuuluvat suomen kielessä substantiiveihin. Ne 
taipuvat luvussa ja sijassa kuten yleisnimetkin ja voivat toimia substan- 
tiivilausekkeissa edussanoina. Proprien ja appellatiivien välinen raja on 
sumea, mutta olennainen ero näiden kahden substantiiviryhmän kesken 
on se, että appellatiivit ilmaisevat luokan, johon samankaltaiset entiteetit 
kuuluvat (esim. kaupunki), mutta proprit nostavat esiin eli identifioivat 
ja erottavat yksilön muiden samaan luokkaan kuuluvien entiteettien jou- 
kosta (esim. Porvoo) (ISK ( 553). 

Normitetussa kirjakielessä proprit kirjoitetaan isolla alkukirjaimella, 
mutta kirjoitetuista teksteistä nimiaineistoa keräävän pitää muistaa, että 
alkukirjain osoittaa vain kirjoittajan tulkinnan eikä rajaa sanan kuulu- 
mista propreihin tai appellatiiveihin. Proprin tunnistamiseen tarvitaan 
siis muita kriteerejä kuin sanan alkukirjaimen koko. 

Frisnimellä on aina jokin muoto, äänneasu, joka viittaa johonkin kie- 
lenulkoiseen entiteettiin, joko todelliseen tai kuvitteelliseen. Tätä enti- 
teettiä kutsutaan nimen referentiksi. Erisnimen tunnistamisen ensim- 
mäinen kriteeri on, että nimi viittaa vain yhteen referenttiin; nimi on siis 
monoreferentiaalinen eli yksiviitteinen sana. 

Käytännössä asia ei kuitenkaan ole näin yksinkertainen. Useimmat tun- 
temamme henkilönnimet viittaavat moniin eri henkilöihin. Etu- ja suku- 
nimen yhdistelmäkään ei ollenkaan aina ole ainutlaatuinen. Saman voi 
todeta monista paikannimistä: esimerkiksi Mustalammet ja Saarijärvet tois- 
tuvat kartalla tiheään tässä tuhansien järvien maassa (ks. Nimisampo). Entä 
sitten sellaiset nimet kuin Adidas tai Ikea? Fivätkö ne olekaan nimiä, kun 
Adidas näkyy kaupan hyllyllä monen tuotteen kyljessä tai kun Ikea lukee 
rakennuksen seinässä niin Raisiossa kuin Tukholmassakin? 

Kaikki edellä mainitut ovat kuitenkin propreja. Ratkaisu ongelmaan 
on konteksti eli esiintymisympäristö. Erisnimi on kontekstissaan yksi- 
viitteinen. Vuorovaikutuksen osapuolilla on yleensä yhteinen käsitys 
siitä, kehen tai mihin nimellä viitataan. Tämä käsitys voi perustua lause- 
yhteyteen (esim. Pääsikö teidän Jenni yliopistoon?) tai asiayhteyteen (esim. 
Naapurini tytär sai opiskelupaikan yliopistosta. Jenni oli sinnikäs; vasta 
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kolmas kerta tuotti tuloksen). Kaupalliset tuotteiden ja yritysten nimet taas 
ovat nimiä, kun ne viittaavat yhteen ainutlaatuiseen, muista tuotteista tai 
yrityksistä eroavaan ideaan — konkreettiset esineet tai rakennukset ovat 
vain tämän idean toisintoja. 

Toisaalta kontekstin pohjalta sanan voi tulkita nimeksi, vaikka sitä 
yleensä pidettäisiin luokittelevana appellatiivina. Jotta kuulija ymmär- 
täisi oikein lauseen Nähdään kirkolla, täytyy hänen tunnistaa sana kirkko 
yhteen tiettyyn kirkkoon viittaavaksi. Vaikka sellaiset sanat kuin kirkko, 
risteys, amis tai äiti ovat joissain konteksteissa tulkittavissa yksiviitteisiksi 
propreiksi, ei niitä onomastiikassakaan yleensä pidetä niminä. 


Sana on mahdollista tulkita kontekstissaan yksiviitteiseksi ja siten 
propriksi vaikkapa taivutuksensa vuoksi. Lihavoitu yliopisto-sana seu- 
raavassa esimerkissä viittaa yksiselitteisesti yhteen tiettyyn yliopistoon, 
tässä kontekstissa Turun yliopistoon: 


”Turun maakuntamuseon lisäksi Ristimäen aineistoa käydään läpi yliopis- 
tolla sekä muissa Suomen yliopistoissa ja tutkimuslaitoksissa.” (Turun Sa- 
nomat 9.10.2017). 


Yksi erisnimen tunnistamisen kriteeri on sen muoto. Monet proprit 
ovat äänneasultaan läpinäkymättömiä, opaakkeja, mikä tarkoittaa, ettei 
ilmaus sisällä kielenpuhujille tuttuja kielen sanoja. Tällaisia ovat esi- 
merkiksi useimmat etunimet (Maija, Eero), lukuisat vanhat paikannimet 
(Naantali, Päijänne, Viro) ja monet yritysten tai tuotteiden nimet (Linux, 
Abloy). On varsin todennäköistä, että tekstissä esiintyvä muodoltaan 
tuntematon ilmaus on erisnimi, ellei se ole esimerkiksi uusi lainasana. 
Toisaalta myös monet läpinäkyvät eli transparentit ilmaukset voidaan 
tunnistaa nimiksi, koska niillä tuskin on kielessä täsmälleen samanlais- 
ta appellatiivista homonyymia (esim. Rautavaara, Housulampi) tai ne 
poikkeavat appellatiiveista prosodisesti, morfologisesti tai syntaktisesti 
(Mustasaari : Mustasaaressa; Varpu : Varpun). (Kiviniemi 1975.) 
Filosofit ovat olleet kiinnostuneita nimistä ja nimien olemuk- 
sesta jo antiikin ajoista lähtien. Muun muassa kysymystä proprin ja 
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appellatiivin välisestä rajasta on kielifilosofiassa pohdittu yhä uudel- 
leen ilman lopullista ratkaisua (esim. Frege 1892; Mill 1906; Jespersen 
1958 [1924]; Gardiner 1940; Russell 1956; Kripke 1972). Varsinainen 
onomastiikka syntyi kuitenkin 1800-luvulla lähinnä arkeologian, his- 
torian ja kielihistorian tarpeisiin, minkä vuoksi tutkimus kohdistui 
ensin lähes yksinomaan paikannimiin. Nimistä ei oltu kiinnostu- 
neita niinkään kielen sanoina vaan muistomerkkeinä menneiden ai- 
kojen ihmisistä, heidän tavoistaan ja kielestään. Ensimmäinen suo- 
malainen nimistöntutkimuksen väitöskirja käsitteli henkilönnimiä: 
A. V. Forsmanin (1891) tutkimuskohteena olivat muinaissuomalaiset 
henkilönnimet. Etymologisen henkilön- ja paikannimitutkimuksen 
avulla onkin pystytty selvittämään merkittävällä tavalla menneisyyteen 
liittyviä kysymyksiä. 

Suomalaisen etymologisen paikannimitutkimuksen uranuurtaja oli 
Helsingin yliopiston nimistöntutkimuksen dosentti ja Suomen nimiar- 
kiston johtaja Viljo Nissilä (1903-1986). Hän keräsi ja tutki kymmeniä- 
tuhansia nimiä eri maantieteellisiltä alueilta Karjalan kannakselta 
Satakuntaan 1930-luvulta alkaen (ks. esim. Nissilä 1939; 1962; 1975). 
Nissilän ansiosta suomalainen onomastiikka saavutti nopeasti kansain- 
välisen tason. (Virtaranta 1973.) 

Lingvistisenä tutkimusalana onomastiikka on 1900-luvulta asti saa- 
nut vaikutteita kulloinkin vallalla olleista kieliteoreettisista näkemyk- 
sistä. Kielen rakenteen abstrahoiminen toisistaan erillisiksi tasoiksi ja 
semantiikan ja pragmatiikan irrottaminen rakenteen tarkastelusta johti 
onomastiikassa siihen, että nimistöä — jota oli semanttisesti hankala ver- 
rata muuhun sanastoon - keskityttiin tutkimaan omana itsenäisenä sys- 
teeminään ja omista typologisista lähtökohdistaan. Tästä näkökulmasta 
nimiä on tietenkin edelleen mahdollista ja tarpeellista tutkia. 

1900-luvun jälkipuolen sosiolingvistiset, systeemis-funktionaaliset, 
psykolingvistiset ja kognitiiviset kieliteoriat ovat havaittavissa, vaikka 
eivät läheskään aina eksplikoituina, 1960-luvun jälkeisessä onomastii- 
kassa. Yhä enenevässä määrin nimiä tarkastellaan osana koko kielisys- 
teemiä, tutkitaan nimeämistä ja nimien käyttöä niin sosiaalisena kuin 
myös kognitiivisena ilmiönä ja pohditaan nimien asemaa osana vies- 
tintää ja vuorovaikutusta. Onomastiikan alalta on 1970-luvulta lähtien 
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valmistunut kiihtyvään tahtiin väitöskirjoja, joiden tutkimuskohteet ja 
-näkökulmat ovat haaroneet moniin eri suuntiin. 

Nimet ovat siis osa kieltä, mutta ne ovat myös kieltenvälisiä, koska 
niitä käytetään usein sellaisenaan kielestä riippumatta: nimet lainautu- 
vat kielestä toiseen helposti. Nimien semanttinen erityisluonne aiheut- 
taa sen, että niiden tutkimuksessa on syytä ottaa huomioon myös kieltä 
laajempi konteksti. Nimet ovat yhteiskunnan toiminnan ja ihmisten 
itsensä kannalta erittäin tärkeitä kielen sanoja. Tutkimuskohteensa ja 
-näkökulmansa mukaan tutkijan on välttämätöntä perehtyä esimerkiksi 
tutkimansa alueen maantieteeseen, tutkimiaan nimiä koskevaan lain- 
säädäntöön, talouselämän realiteetteihin, sosiaalisiin näkökulmiin tai 
identiteettikysymyksiin. 


3. Nimistöaineistot ja niiden analyysi 


Tässä luvussa esitellään kymmenen erilaista nimistöntutkimuksen 
analyysimallia. Esiin nousevat typologinen analyysi, kognitiivinen 
merkitysanalyysi, leksikaalis-etymologinen analyysi, kontaktionomas- 
tiikka, sosiolingvistinen variaationanalyysi, nimet vuorovaikutuksessa, 
kansanonomastiikka, tekstianalyyttinen ja diskurssianalyyttinen metodi, 
nimimaisematutkimus ja multimodaalinen analyysi sekä suuret kor- 
pukset ja niiden määrällinen analyysi. On syytä muistaa, että nimistöä 
voi käytännössä tutkia monilla niillä metodeilla, joita tässä teoksessa 
esitellään. Nimistön tietynlainen erikoisluonne lingvistisenä kohteena 
on kuitenkin otettava huomioon metodia sovellettaessa, ja tietyt metodit 
ovat toistaiseksi vakiintuneempia onomastiikassa kuin toiset. 


3.1. Typologinen analyysi 


Nimiä ja nimistöjä tutkittaessa typologinen analyysi jää vain harvoin syr- 
jään. Vaikka ensisijaisena tutkimuskohteena olisi jokin muu, on tutkijan 
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kuitenkin ensin otettava selvää nimien typologiasta eli siitä, millä tavoin 
ja millä perustein nimet jaetaan eri nimenosiin. Tässä luvussa esitel- 
lään keskeisimmät nimistön rakenneanalyysit: syntaktis-semanttinen, 
funktionaalis-semanttinen ja henkilönnimien rakenneanalyysi. 

Syntaktis-semanttinen rakenneanalyysi. Syntaktis-semanttinen ra- 
kenneanalyysi on perinnäisten paikannimien rakenteen ja semantiikan 
ymmärtämiseksi luotu malli (Kiviniemi 1975; Zilliacus 1966). Metodin 
kehittämisen taustalla vaikutti transformatiivis-generatiivinen kielioppi 
(ks. Kiviniemi 1987). Mallissa pyritään nimenantajan näkökulmasta sel- 
vittämään, mitkä asiaperusteet ovat löydettävissä nimeämisen taustalta. 
Nimet jaetaan ensin syntaktisiin rakenneosiin eli nimenosiin. Ne taas 
ovat löydettävissä nimien ns. syvärakenteiden avulla, jotka ovat nimien 
pintarakenteiden taustalla olevia lauseparafraaseja. Esimerkiksi lammen 
nimen Mustalampi lauseparafraasi voi olla 'lampi, jonka vesi on mus- 
taa”. Näin lauseparafraasi paljastaa nimen kaksi syntaktista rakenneosaa 
(musta + lampi) ja niiden syntaktisen suhteen. 

Syntaktinen nimenosa ilmaisee yhden tarkoitetta luonnehtivan sei- 
kan eli yhden paikalle ominaisen piirteen. Näitä nimenosia voi olla kol- 
menlaisia. Ensiksikin nimenosa voi olla paikan lajia ilmaiseva (Musta/ 
lampi). Kaksiosaisen yhdysnimen jälkiosa eli nimen perusosa on yleen- 
sä juuri esimerkin kaltainen paikkaa luonnehtiva appellatiivi. Toiseksi 
nimenosan funktio voi olla erityispiirrettä ilmaiseva (Musta/lampi), jol- 
loin nimi ilmaisee jotakin nimen tarkoittamasta paikasta. Useimmiten 
erityispiirrettä ilmaisevat nimenosat esiintyvät nimissä määriteosina eli 
ovat yhdysnimen alkuosina. Kolmanneksi nimenosan funktio voi olla 
nimittävä, ja tällainen funktio voi olla joko määrite- tai perusosalla. Ni- 
mittäviä ovat sellaiset propriset eli nimen sisältävät nimenosat, joilla ei 
ole erityispiirrettä ilmaisevaa funktiota. Nimenosa ei siis ilmaise paikan 
lajia eikä kuvaile paikkaa jonkin sen erityispiirteen osalta. Tällaisia ovat 
esimerkiksi lainanimet (Porvoo vrt. Borgä), joita lainanottajien kannalta 
voidaan kuvailla sisällöttömiksi. 

Rakenneanalyysin seuraava vaihe on erityispiirrettä ilmaisevien ni- 
menosien luokittelu sekä lausesemanttisesti että sanasemanttisesti. 
Lausesemanttisessa luokittelussa selvitetään nimien nimeämisperus- 
teet. Ne ovat kielenulkoiseen todellisuuteen liittyviä seikkoja, kuten 
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paikan sijainti tai ominaisuus. Sanasemanttinen luokittelu puolestaan 
ilmaisee sen leksikaalisen kategorian, johon kuuluvalla ilmauksella ni- 
meämisperuste on ilmaistu. Esimerkiksi nimessä Mustalampi määrite- 
osa Musta kertoo paikan ominaisuudesta ja leksikaalisena kategoriana se 
on adjektiivi. Mallissa lause- ja sanasemanttisella luokittelulla on omat 
kirjainkoodit. (Kiviniemi 1990.) 

Mallia on käytetty laajalti perinnäisen paikannimistön tulkinnassa. 
Tällöin aineistona on voinut olla esimerkiksi jonkin kylän koko nimistö, 
ja analyysin tuloksena on yleensä pystytty tulkitsemaan eli sijoittamaan 
luokitteluun suuri osa paikannimistä, jopa yli 90 prosenttia. On kui- 
tenkin otettava huomioon, että kaikkien nimien nimeämisperusteista 
ei voi saada varmaa vastausta. Lisäksi luokittelu ei sovi muun kuin pe- 
rinnäisen paikannimistön analyysiin. Kaavanimistöä ei siis pidä lähteä 
analysoimaan tätä mallia käyttäen. 


Nimenosan syntaktis-semanttinen funktio voi olla: 

A = paikan lajin ilmaiseva (Musta/lampi) 

B = nimittävä (Porvoo) 

C = erityispiirrettä ilmaiseva (Musta/lampi) 

Koodin alussa oleva numero ilmaisee nimenosien lukumäärän. 
Esimerkkejä: 

Musta/lampi 'lampi, jonka vesi on mustaa' 2 CA 

Mustalampi ' (talo) Mustalammen rannalla’ 1 C 

Iso / Mustalampi "isompi Mustalampi-nimistä lammista’ 2 CB 
Katinhäntä 'Katinhännän muotoinen (pelto)' 1 C 


Niemi niemi 1A 
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Funktionaalis-semanttinen rakenneanalyysi. Perinnäisten maaseudun 
paikannimien tutkimiseen kehitetty syntaktis-semanttinen malli ei so- 
vellu kaikkien nimikategorioiden typologiseen analyysiin. Perinnäiset 
paikannimet on yksinkertaista jakaa syntaktiselta pohjalta perus- ja 
määriteosiin, ja nimeämisen perusteet on periaatteessa mahdollista jäl- 
jittää nimen syntyhetkellä vallinneisiin olosuhteisiin. Sitä vastoin monet 
muut nimikategoriat ovat rakenteeltaan paljon kompleksisempia (esim. 
asunto-osakeyhtiön nimi Turun työläisten as.oy Itärinne) tai ne perus- 
tuvat aivan toisenlaisiin seikkoihin kuin tarkoitteen sijaintiin, ominai- 
suuteen tai käyttöön (esim. kaupunkinimistössä tavalliset muistonimet, 
kuten Sibeliuksenkatu). 

Yritysten nimien rakenneanalyysiin kehitetty funktionaalis- 
semanttinen analyysimalli (Sjöblom 2006) soveltuu metodiksi erityisesti, 
kun halutaan tarkastella nimiä, jotka ovat syntyneet tietoisen ja harkitun 
nimeämisprosessin kautta ja joilla on useita eri käyttöfunktioita. Tällais- 
ten nimien rakenne voi olla erittäin monimutkainen: nimet ovat usein 
monisanaisia, eikä niistä ole mahdollista tunnistaa elementtejä, jotka oli- 
sivat selkeässä perus- ja määriteosasuhteessa toisiinsa. Monilla nimillä 
on virallisen, johonkin rekisteriin kirjatun muodon lisäksi jokin lyhyempi 
käyttömuoto. 

Funktionaalis-semanttisessa analyysissa selvitetään aluksi, millaisista 
funktionaalisista osista kompleksiset nimet koostuvat. Mallissa nimen- 
osat määritellään nimikategorian omista lähtökohdista käsin. Yritysten 
nimet, tuotteiden nimet tai verkkopalvelujen käyttäjänimet ovat kaikki 
rakenteeltaan erilaisia. Nimitypologian selvittämiseksi onkin perehdyt- 
tävä suureen joukkoon saman kategorian nimiä, joita vertaamalla funk- 
tionaaliset osat paljastuvat. Koska nimen perustehtävä on aina yksilöinti, 
on kaikissa nimissä välttämättä jokin osa, jota voi pitää nimen varsinai- 
sena yksilöivänä osana. 


Esimerkiksi viralliset, rekisteröidyt yritysnimet voivat sisältää neljänlaisia 
nimenosia: yritysmuodon ilmaisevan osan, liikeidean ilmaisevan osan, 
yksilöivän osan ja täydentävää informaatiota antavan osan. Näiden 
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nimenosien järjestys voi vaihdella, eikä niiden keskinäistä syntaktista 
suhdetta voi määritellä helposti. Kaikissa yritysnimissä ei myöskään ole 
kaikkia neljää osaa. Vain yksilöivä osa on pakollinen — myös lain mukaan. 


Esimerkki rekisteröidyn yritysnimen nimenosista: 


Kauneushoitola Päivänpaiste tmi Tarja Tappurainen 


liikeideaosa yksilöivä osa yritysmuoto-osa täydentävä osa 


Analyysin toisessa vaiheessa selvitetään, minkätyyppisistä ilmauksis- 
ta eri nimenosat, etenkin yksilöivät nimenosat, rakentuvat eli millaisia 
sana-aineksia ne sisältävät. Ne voivat sisältää esimerkiksi henkilön- tai 
paikannimiä tai muita erisnimiä (Wärtsilä, Otava), appellatiiveja tai mui- 
den sanaluokkien sanoja (Kone, Metso, Valio), useammasta sanasta koos- 
tuvia lausekkeita, fraaseja, tekosanoja, kirjainlyhenteitä tai numeroita 
(Teollisuuden Voima, Scanfil, UPM, St1). Lisäksi monien nimikategorioi- 
den kannalta myös nimien ja nimenosien kielen määrittely sekä nimien 
ortografia voi olla merkittävää. 

Typologisen analyysin tavoitteena on saada aineistosta yleiskuva, 
jonka perusteella voidaan selvittää vastausta kysymykseen, miksi nimet 
ovat sellaisia kuin ovat. Funktionaalis-semanttista analyysia voikin jatkaa 
tutkimalla tarkemmin nimien semantiikkaa ja funktioita (ks. luku 3.2.). 

Funktionaalis-semanttista mallia on sovellettu etenkin kaupallis- 
ten nimien (yritys- ja tuotenimet) ja verkkoympäristön käyttäjänimien 
(esim. Hämäläinen 2016) typologiseen analyysiin. Koska malli on jous- 
tava ja siinä otetaan huomioon nimikategorian ominaispiirteet, sitä voi 
kokeilla myös muiden sellaisten nimien luokitteluun, joita on vaikea 
sovittaa syntaktis-semanttisen rakenneanalyysin kaavaan. Esimerkiksi 
ravihevosten nimien", koirien kennelnimien tai vaikkapa lastenkirjal- 
lisuuden nimien? tutkimuksessa mallia voi mahdollisesti hyödyntää. 
Kaikkien nimien typologiaa ei kuitenkaan voi selvittää tälläkään ana- 
lyysimenetelmällä. Esimerkiksi erilaisten taideteosten (kirjojen, tau- 
lujen, elokuvien jne.) nimiä ei välttämättä pysty jaottelemaan funktio- 
naalisiin saati syntaktisiin osiin, vaan nimet saattavat muodostaa yhden 
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erottamattoman kokonaisuuden. Tällaisillakin nimillä on omat typologi- 
set piirteensä, mutta niitä on tutkittu toistaiseksi erittäin vähän. 

Henkilönnimien rakenneanalyysi. Henkilönnimet voidaan jakaa 
karkeasti kahteen pääryhmään, yksilöihin viittaaviin nimiin (esim. etu- 
nimet) ja kollektiivisiin nimiin (esim. sukunimet). Eri kulttuureissa hen- 
kilönnimisysteemit ovat hyvin erilaisia jopa Euroopan mittakaavassa; 
esimerkkinä vaikkapa Islannin etunimi + isännimi -systeemi ja Espan- 
jan etunimi + isän sukunimi + äidin sukunimi -systeemi. (Lisätietoa 
henkilönnimisysteemeistä, ks. Ainiala, Saarelma & Sjöblom 2008.) 
Henkilönnimien typologian tutkimiseen on olemassa eri menetelmiä. 

Etunimiä on perinteisesti luokiteltu etymologisin perustein eri- 
ikäisiin kerrostumiin. Muinaissuomalaisista nimistä tiedetään melko vä- 
hän, koska kirjalliset lähteet ovat harvassa ja kristinuskon myötä nimistö 
vaihtui meillä pikkuhiljaa kokonaan kristilliseksi saamelaisasutusta lu- 
kuun ottamatta. Tärkeitä tutkimuslähteitä ovat meillä kuitenkin olemas- 
sa olevat sukunimet ja paikannimet, joissa on säilynyt paljon vanhaa 
henkilönnimistöä. 

Kristillisperäisiksi nimiksi luetaan paitsi raamatulliset (Uuden ja Van- 
han testamentin) nimet myös muiden eurooppalaisten kansojen alku- 
peräiset pakanalliset nimet, joista tuli pyhimysten nimiä (esim. Erik, 
Kerttu < Gertrud). 1800-luvulta lähtien etunimistöön on tullut jälleen 
vanhoja suomalaisnimiä (Väinö, Kyllikki) ja uusia omakielisiä nimiä 
(Urho, Rauha). Uusimpiin nimikerrostumiin kuuluu suomenkielisiä 
nimiä, muista kielistä lainattuja nimiä sekä uniikkeja sepitteitä. 


Katolisen kirkon keskiaikainen pyhimyskalenteri sisälsi nykyisin tunte- 
maamme nimipäiväkalenteriin verrattuna paljon vähemmän eri nimiä. 
Lisäksi useimmat pyhimysnimet olivat miesten nimiä. Lasten nimeä- 
misessä päädyttiin usein samaan nimeen. Keskiajalla Johannes oli 
Euroopassa jossain vaiheessa niin tavallinen nimi, ettei se erotellut enää 
riittävästi edes pienen yhteisön yksilöitä toisistaan. Sen vuoksi nimestä 
otettiin käyttöön useita eri variantteja. Suomessa Johanneksen variantteja 
ovat mm. Jussi, Janne, Juha, Juho, Jani, Juhani, Hannes ja Hannu. 
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Viimeaikaisessa etunimitutkimuksessa käyttökelpoiseksi on osoittautu- 
nut muotin käsite (Sartjärvi 2013; vrt. ISK § 148), jonka rinnalla voitaisiin 
käyttää myös konstruktion käsitettä. Etunimet muodostavat samaloppui- 
sia rypäitä, jotka toimivat mallina uusille etunimille. Esimerkiksi nimet 
Eija, Seija, Maija, Aija ja Tuija mukautuvat etunimimuottiin (C) V+ija, 
jota voidaan käyttää edelleen uusien nimien muodostamiseen (esim. 
Beija, Freija, Paija, Roija, Toija, Viija). Naistennimissä etunimimuottien 
vaikutus näkyy selvemmin kuin miestennimissä, mikä johtuu siitä, että 
tytöille annetaan ylipäätään enemmän erilaisia nimiä kuin pojille. Poi- 
kia nimetään useammin suvun nimien mukaan, minkä vuoksi pojilla 
käytössä oleva nimivarasto ei ole yhtä suuri kuin tytöillä. 

Suomalaisia sukunimiä voidaan luokitella rakenteensa perusteella 
kantasana- ja yhdyssanatyyppisiin sekä johtimellisiin nimiin. Kantasana- 
tyyppiset sisältävät suomen kantasanoja, kuten Laine, tai muita yksiosai- 
sia ilmauksia, kuten etunimiä (Pentti), niistä johdettuja hypokorismeja 
(Rusi < Erasmus) tai uusmuodosteita, kuten Vento. Yhdyssanatyyppiset 
sukunimet ovat yleensä joko vanhoja talonnimiä (Saarikoski) tai uusia, 
sukunimiksi sepitettyjä muodosteita (Vuorenjuuri). Yleisimmät suoma- 
laiset sukunimijohtimet ovat -[A, -nen, -mO, -iO, -mA ja -stO. (Suomalai- 
sesta sukunimisysteemistä lisää ks. Paikkala 2004.) 

Epávirallista henkilönnimistöä ovat lisä- ja pilkkanimet (Pontikka-Topi, 
Hönö), erilaiset hellittelynimet (Annuliini) ja hypokorismit eli virallisesta 
nimestä johdetut nimiasut (Pirkko > Pike). Analyysissa on tapana jakaa 
nämä nimet sekundaareihin ja primaareihin lisänimiin. Sekundaarien 
lisänimien pohjana ovat ihmisten viralliset etu- ja sukunimet (Kalervo > 
Kale, Peltonen > Peltsi), ja primaarit lisänimet perustuvat johonkin muu- 
hun ihmiseen liittyvään seikkaan, kuten ulkonäköön, ammattiin, käyttäy- 
tymiseen tai tapahtumaan. Sekundaarien lisänimien muodostamiseen 
käytetään yleisiä sananmuodostuskeinoja, kuten typistämistä, johtamista 
ja äänteellistä muuntelua, ja apua on erityisesti slangijohtimien ja -johta- 
missääntöjen tuntemuksesta. (Ainiala, Saarelma & Sjöblom 2008.) 

Henkilönnimien typologian tutkimukseen aineistoa voidaan kerätä 
esimerkiksi eri aikojen nimipäiväkalentereista (ks. Saarelma 2006) sekä 
Väestörekisterikeskuksen etu- ja sukunimirekistereistä. 
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3.2. Kognitiivinen merkitysanalyysi 


Perinnäisissä paikannimissä nimen syntyhetken nimeämisperuste ja 
nimen silloinen sisältö eivät myöhemmän käytön kannalta ole merki- 
tyksellisiä, vaan paikannimi yksilöi tietyn paikan riippumatta siitä, tun- 
nistavatko kielenpuhujat nimeämisperusteen vai eivät. Monissa muissa 
nimikategorioissa nimeen sisältyvien sanojen merkitys voi kuitenkin 
olla nimen käyttäjien kannalta oleellinen. Esimerkiksi monien yritysten 
ja tuotteiden nimet tai vaikkapa henkilöiden epäviralliset nimet toimivat 
parhaiten tehtävässään, kun niiden sisältö on tunnistettavissa ja tavalla 
tai toisella tulkittavissa. Alkuperäinen nimeämisperuste ei ole tällaisten 
nimien käytön kannalta oleellinen, vaan oleellisempaa on tiedostaa ni- 
men välittämät viestit. Tällaisiin tapauksiin tarvitaan metodi, joka ottaa 
huomioon identifioinnin lisäksi myös nimen muut mahdolliset tehtävät. 
Näihin tehtäviin nimen sisältö voi vaikuttaa ratkaisevasti. 

Kognitiivinen merkitysanalyysi on malli, joka on syntynyt funktionaa- 
lis-semanttisen rakenneanalyysin (ks. luku 3.1.) täydennykseksi (Sjöblom 
2006). Malli perustuu kognitiiviseen kielinäkemykseen ja tarkastelee ni- 
miä osana koko kielisysteemiä sekä suhteessa ihmisen tietorakenteisiin 
ja kommunikaatiotilanteisiin. Nimiä voi pitää muiden kielten sanojen 
tapaan symbolisina yksiköinä, joilla on muoto ja merkitys. Merkitys tar- 
koittaa proprin muodon aktivoimia linkkejä eri kognitiivisiin alueisiin 
eli merkitysyhteyksiä, joista osa on subjektiivisia mutta osa kielenpuhu- 
jille yhteisiä? 

Kognitiivisen merkitysanalyysin tavoitteena on selvittää funktionaalis- 
semanttisen analyysin perusteella löydettyjen nimenosien semanttiset 
piirteet. Erityisen kiinnostavaa on tutkia yksilöivän osan sisältämän 
kielellisen ilmauksen merkitystä ja suhteuttaa se nimen tarkoitteeseen. 
Toisin sanoen menetelmällä kuvataan, millaisessa merkityssuhteessa 
nimi on tarkoitteeseensa nähden. Tämä vaatii tietysti nimen tarkoittees- 
ta riittävästi taustatietoa. 

Useimmiten nimenosan merkityssuhde nimen tarkoitteeseen on joko 
suora tai epäsuora. Suora merkityssuhde tarkoittaa sitä, että nimenosa 
kertoo tarkoitteesta asioita suoraan: esimerkiksi nimessä Kukkakauppa 
Virtanen liikeideaa ilmaiseva nimenosa Kukkakauppa ilmaisee yrityksen 
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toimialan ja Virtanen omistajan tai perustajan sukunimen. Fpäsuora 
merkityssuhde taas tarkoittaa sitä, että nimenosan sisältämät ilmaukset 
ovat yhteydessä nimen tarkoitteeseen jonkin assosiaation kautta eli joko 
metonyymisesti kosketusassosiaation kautta (esim. kampaamon nimi 
Rajut rastat) tai metaforisesti yhtäläisyysassosiaation kautta (esim. päivä- 
kodin nimi Satumetsä). Joskus nimenosan suhde tarkoitteeseen voi olla 
myös kompleksisempi tai nimenosan muodon ja tarkoitteen välillä ei 
ole lainkaan välitöntä merkityssuhdetta, vaan nimeen kiinnittyvät mer- 
kitykset rakentuvat välillisesti ajan kuluessa. (Sjöblom 2006.) 

Kognitiiviseen analyysimalliin kuuluu myös nimien sosiokulttuu- 
risten funktioiden tarkastelu. Tällöin pohditaan vastausta siihen, mik- 
si nimet ovat sellaisia kuin ovat. Taustalla on ajatus, että merkitysten 
tuottaminen ei ole koskaan itseisarvo vaan merkityksellä on aina jokin 
funktio. Esimerkiksi yrityksen nimi saattaa integroida yrityksen muiden 
saman alan yritysten joukkoon tai jonkin kaupunginosan epävirallinen, 
lyhyt nimi voi helpottaa nimen käyttöä. Nimen tehtävänä voi olla myös 
nimen tarkoitteen, kuten jonkun henkilön tai jonkin paikan, pilkkaa- 
minen. Tavallisimpia nimien funktioita ovat personoiva, houkutteleva, 
käytännöllinen, informatiivinen, integroiva, esteettinen ja pilkkaava 
funktio. Nimikategoriasta riippuen muitakin funktioita voi löytää. Mo- 
net nimet toimivat samanaikaisesti useassa eri funktiossa. Kognitiivista 
mallia on sovellettu muun muassa laivojen (Schybergson 2009) ja ajo- 
neuvojen epävirallisten nimien (Seppälä 2013) tutkimiseen. 

Erotuksena nimien typologiseen analyysiin kognitiivinen näkökulma 
mahdollistaa nimien merkityksen synkronisen tarkastelun riippumatta 
diakronisesta nimeämisen motiivista. Kognitiivisessa analyysissa näkö- 
kulma on kieliyhteisössä, nimenkäyttäjissä ja heidän tulkinnoissaan, 
kun taas varsinkin syntaktis-semanttisessa analyysissa näkökulma on 
nimeämishetkessä, nimenantajassa ja nimeämisperusteissa. Kaikissa 
edellä kuvatuissa metodeissa lähestytään kuitenkin nimistöä systeemi- 
nä, joka tarjoaa kieliyhteisölle ja nimenantajille mallin uusien nimien 
muodostamiseen. (Sjöblom 2004; 2006, 62—74.) 
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3.3. Leksikaalis-etymologinen analyysi 


Leksikaalis-etymologisessa analyysissa selvitetään nimen alkuperää eli 
sitä, mistä ja mitä merkitsevistä kielellisistä elementeistä nimi koostuu ja 
millainen on ollut nimen alkuperäinen asu. Aivan ensimmäiseksi tulee 
tutkia, mitä kieltä nimi alkuaan on ollut. Monien taustaltaan hämärien 
nimien kohdalla kysymys voi jäädä lopullista vastausta vaille (Imatra, Päi- 
jänne, Hyrkäs, Kuronen), mutta perusteltuja vaihtoehtoja on silti yleensä 
löydettävissä. Lisäksi nimi pyritään ikäämään niin tarkoin kuin mahdol- 
lista. län määrittämisessä apuna ovat varhaiset asiakirja- ja karttamerkin- 
nät, jotka kertovat ainakin sen, milloin nimi viimeistään on ollut käytössä. 

Jos nimi koostuu tutuista kielen sanoista eli on läpinäkyvä, on nimen 
alkuperän selvittäminen huomattavasti helpompaa kuin läpinäkymät- 
tömien nimien kohdalla. Läpinäkyvänkin nimen kohdalla on kuitenkin 
perusteltua lisäksi selvittää, mikä nimen nimeämisperuste on ollut (ks. 
syntaktis-semanttinen rakenneanalyysi luvussa 3.1.) ja mitä nimen lek- 
seemit tai muut elementit juuri tässä nimessä merkitsevät. Esimerkiksi 
Kirkkokallio-nimen nimeämisperusteena voi olla esimerkiksi 'kallio, jolla 
sijaitsee kirkko’ tai kallio, joka muistuttaa kirkkoa”. Akanniemi-nimi puo- 
lestaan on edellistä monitulkintaisempi, koska emme tiedä, viittaako akka 
nimessä esimerkiksi vanhaan naiseen, isoäitiin tai voiko se olla mytologi- 
nen, jolloin viitattaisiin paikan rituaaliseen luonteeseen (ks. Mallat 2007). 

Nimeen sisältyvät sanat ja muut kielelliset ainekset voivat olla sellai- 
sia, ettemme enää tunnista nimen sisältöä. Tällaiset läpinäkymättömät 
nimet voivat sisältää aineksia, jotka ovat jääneet pois paikallisesta kie- 
lestä. Esimerkiksi kainuulaisen kylännimen Neittävä taustalla lienevät 
murteissa vanhastaan tunnetut verbit neitää ja neityä 'vuotaa, tihkua 
läpi; kostua’. Alue on kahden vesistön välisellä alavalla maalla, joten 
merkitykseltään nimi sopii paikalle hyvin. Tutkijan tulee siis hankkia 
laaja-alaisesti tietoa kielihistoriasta ja murteista sekä lisäksi maan- 
tieteen, paikallishistorian ja muiden lähitieteiden avulla selvittää, mil- 
laisia nimetyt kohteet nimenantoaikoina ovat voineet olla. 

Nimi voi olla läpinäkymätön eli hämärä siksikin, että siinä on ai- 
kojen kuluessa tapahtunut erilaisia rakenteellisia ja äänteellisiä muu- 
toksia. Paikannimen määriteosassa on esimerkiksi voinut tapahtua 
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loppuheitto (Hailuoto < Haililuoto; haili ’silakka’, Koijärvi < Koivujärvi), 
ja nimen perusosa taas on voinut ikään kuin kulua (Mustajoki > Mustio). 
Nimen alkuperäisen tai ainakin vanhemman asun etsinnässä vanhat 
asiakirja- ja karttamerkinnät voivat olla arvokkaita. Esimerkiksi hämä- 
läinen Mainiemi-nimi on mainittu 1500-luvun alun asiakirjassa asussa 
Mayenemi, joka todennäköisesti on monien alueen muiden maja-nimien 
lailla lyhentynyt majava-nimestä ja viittaa majavien pesimiseen alueella. 
Nimien alkuperää tutkittaessa pitääkin tuntea myös alueen ja yhteisön 
muu nimistö ja sen rakenne, jotta voi päätellä, millaiset leksikaaliset, 
rakenteelliset ynnä muut kielelliset valinnat sekä nimeämisperusteet 
ylipäänsä ovat mahdollisia. 

Nimistöntutkijan on lisäksi otettava huomioon, että paikannimiä 
annetaan usein olemassa olevan nimistön mukaan. Tällöin puhutaan 
analogiasta ja analogisesta nimenannosta. Esimerkiksi ensimmäisen 
partisiipin sisältämistä nimistä (esim. Törisevä, Kohiseva) lähes puolet on 
syntynyt olemassa olleiden, samantyyppisten ja samakantaisten nimien 
mukaan (Kiviniemi 1971; 1977). Alueilta toisille siirtyneet väestöryhmät 
ovat usein ottaneet mukaansa lähtöseutunsa nimeämismalleja, ja näin 
on voitu tutkia asutushistoriaa (esim. Vahtola 1980). 


3.4. Kontaktionomastiikka 


Nimet lainautuvat kielestä toiseen huomattavasti helpommin kuin muut 
kielenainekset. Lainatut nimet voivat joko muuntua uuteen kieleen sopi- 
viksi tai pysyä alkuperäisessä asussaan. Lisäksi nimet ja nimisysteemit 
elävät usein rinnan eri kielissä ja kielimuodoissa ja niillä voi olla eri 
funktioita. Kaikkia näitä kysymyksiä tutkitaan kontaktionomastiikassa. 
Suomen kieleen (ja sitä edeltäviin kielimuotoihin) on aina tullut vai- 
kutteita muista kielistä ja kulttuureista. Nämä näkyvät yhä vahvasti nimis- 
tössämme. Esimerkiksi kristinusko toi 1100-luvulta alkaen alueellemme 
kristillisperäistä henkilönnimistöä (esim. Antti, Lauri), joka jätti syrjään 
muinaissuomalaisen nimistön (Ihamieli, Hyvätoivo). Tässä muutoksessa 
oli kyse jo koko nimisysteemin vaihtumisesta toiseen. Nimisysteemin 
lähes täydellisestä vaihtumisesta tuoreempi esimerkki on puolestaan 
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Namibian Ambomaasta, jossa suomalaisten ja muiden eurooppalaisten 
lähetystyö 1900-luvulla aiheutti sen, että monet ambomaalaiset ottivat 
käyttöönsä eurooppalaisia nimiä (Saarelma-Maunumaa 2003). 

Maamme kunnan- ja kylännimistä monet sisältävät jälkiä varhaisista 
germaanivaikutuksista. Esimerkiksi keskiaikaisen Raaseporin linna- 
läänin kylännimistä useiden taustalla on germaaninen tai myöhempi 
skandinaavinen henkilönnimi (Raunamaa 2017). Lisäksi esimerkiksi 
Harjavalta-nimeen sisältyy kantagermaanin kaksiosainen miehennimi 
*Harja-walöa ja Hollola-nimeen germaanisperäinen henkilönnimi Holl, 
Hollo tai muu vastaava. Kyseessä ovat siis germaanista lainatut henkilön- 
nimet, joita alueen asukkailla on ollut käytössä. Sen sijaan nimet eivät 
luonnollisestikaan osoita, että alueella olisi asunut germaanista kieltä 
puhunutta väestöä. Jotta voidaan päätellä nimien kielellinen alkuperä, 
tarvitaan pohjaksi leksikaalis-etymologinen analyysi (ks. luku 3.3.). Ni- 
men kielen alkuperän selvittäminen ei aina ole helppoa. Jos se pystytään 
selvittämään, voidaan usein päätellä jotain myös nimenannon ajasta. 
Tämä taas johtuu siitä, että kielihistorian, historian ja arkeologian avulla 
tiedetään, milloin ja missä tiettyjä kieliä on voitu puhua. 

Koska Suomessa on jo kauan puhuttu pääosin suomea, ruotsia ja 
saamen kieliä näiden kielimuotojen edeltäjineen, on näiden nimien ja 
nimisysteemien kohtaamista eritoten paikannimistössä myös tutkittu 
ahkerasti. Kieliraja-alueille on syntynyt runsaasti lainanimistöä. Eteläi- 
sintäkin Suomea myöten on saamelaisperäisiä paikannimiä: esimerkik- 
si Kukasjärvi sisältää pohjoissaamen 'pitkàà' merkitsevän sanan guhkes. 
Parhaiten tunnettuja ovat kuitenkin suomalais-ruotsalaisten alueiden 
substraattinimistöt eli ne nimet, joita näillä alueilla on käytetty ennen 
kuin sinne on tullut myöhempää, erikielistä asutusta (esim. Mossala < 
Mustasalo) ja jotka sitten uusien asukkaiden suussa ovat mukautuneet 
lainanottajakielen puhujille paremmin sopiviksi (ks. esim. Pitkänen 
1985). Substraattinimi määritellään jossakin maassa tai jollakin alueella 
aiemmin puhuttuun kieleen perustuvaksi nimeksi. Lainanimi puolestaan 
on kielestä toiseen lainattu saman kohteen nimi. Kun nimiä lainataan 
kielestä toiseen, käännetään nimi vain harvoin. Tavallisempaa on, että 
nimi lainataan äännemukaelmana: joko kokomukaelmana (Laajalahti > 
Lalax, Bredvik > Preiviikki, Preiviikin/lahti) tai osamukaelmana (Prei/lahti). 
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Kaksi- ja monikielisillä alueilla nimet ja nimisysteemit ovat jatkuvas- 
ti kosketuksissa keskenään. Suomen virallisesti kaksikielisillä alueilla 
kaavanimet annetaan molemmilla kielillä. Alueen puhujat voivat käyt- 
tää kummankinkielisiä nimiä, ja varsinkin vähemmistökieliin kuuluvat 
saattavat usein puhua paikoista enemmistökielen nimeä käyttäen. Esi- 
merkiksi Helsingissä ruotsinkieliset voivat paitsi käyttää suomenkielistä 
nimeä myös muodostaa ruotsinkielisen nimen suomenkielisen pohjalta 
(esim. Pengergatan po. Terrassgatan) (ks. Vidberg 2016). 

Kaksi- ja useampikielisissä perheissä kielten kohtaaminen näkyy 
usein konkreettisesti lasten nimenvalinnassa. Nimiksi pyritään anta- 
maan monesti sellaisia nimiä, jotka toimivat molemmissa kielissä. Niitä 
nimiä taas vältetään, jotka olisivat toiselle kielelle äänteellisesti hankalia 
tai epämiellyttäviä merkityssisältöjä kantavia. 

Menneinä vuosina kielten väliset kontaktit tapahtuivat vain jollain 
tietyllä maantieteellisellä alueella, mutta internet ja ihmisten ja väestö- 
jen yhä vilkkaampi ja laajempi liikkuvuus ovat muuttaneet kielikontak- 
tit globaaleiksi. Ilmiön vaikutus näkyy paitsi henkilönnimistössä myös 
erityisesti kaupallisissa nimissä, joiden kielellisen alkuperän analysoi- 
minen avaa kiinnostavia näkökulmia muun muassa retoriikan, kieli- 
maiseman ja kielen valtarakenteiden tutkimiseen (ks. luvut 3.8. ja 3.9.). 
(Yritysnimien kielellisen alkuperän selvittämisestä ks. Sjöblom 2006.) 


3.5. Sosiolingvistinen variaationanalyysi 


Nimien sosiolingvististä variaatiota eli vaihtelua tutkittaessa kohteena on 
joko sosiaalinen eli käyttäjäkohtainen tai tilanteinen eli tilannekohtainen 
variaatio. Sosiaalista variaatiota tutkitaan ottamalla huomioon erilaisia 
kielenulkoisia muuttujia, kuten ikä, sukupuoli, syntyperä, ammatti tai 
koulutus ja (muu) sosioekonominen asema. Tässä luvussa keskitytään 
sosiaaliseen variaatioon, koska tilanteinen variaatio nousee esiin myös 
luvuissa 3.6. ja 3.7. 

Sosiaalista variaatiota on tutkittu ennen kaikkea paikannimistössä. 
On koottu paikannimiaineistoja haastattelemalla saman alueen asukkai- 
ta (ks. Haastattelu aineistonkeruun metodina sosiolingvistiikassa tk.) ja 
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sitten verrattu näitä nimistöjä toisiinsa. Näistä aineistoista on selvitet- 
ty, kuinka paljon ja millaista paikannimistöä eri-ikäiset, eri sukupuolta 
olevat ja eri ammateissa toimivat omalla asuinseudullaan tuntevat ja 
käyttävät (esim. Ainiala, Komppa, Mallat & Pitkänen 2000). Erikseen 
on tutkittu myös lasten nimistönkäyttöä ja havaittu esimerkiksi, että pel- 
kän paikan lajin ilmaisevat appellatiivit riittävät varsinkin pienemmillä 
lapsilla usein nimiksi (Tikka 2009). Ylipäänsä nimikompetenssia tut- 
kittaessa on lisäksi pyritty löytämään syitä sille, miksi yksilöiden nimi- 
varastot eroavat toisistaan. Vaikka varhaisimmissa tutkimuksissa (esim. 
Slotte, Zilliacus & Harling 1973) sukupuolta ja ikää pidettiin merkittä- 
vämpinä erojen selittäjinä, on myöhempi tutkimus tuonut esiin, että 
pikemmin eroja selittävät ammatti ja harrastukset (Ainiala, Komppa, 
Mallat & Pitkänen 2000). Tällaisia tutkimuksia on kutsuttu nimitaidon 
ja (paikan)nimikompetenssin tutkimuksiksi; edellistä käsitettä voi pitää 
jo hieman vanhentuneena. 

Edellä mainitut nimikompetenssin tutkimukset ovat kohdistuneet 
maaseudun nimistön tarkasteluun. Kaupunkiympäristö on tyypillisesti 
monikerroksisempi ja heterogeenisempi, mikä tulee ottaa huomioon 
tutkimusaineistojen ja -metodienkin valinnassa. Kaupungissa erilaisia 
sosiaalisia muuttujia on helposti tarjolla enemmän kuin pienemmässä 
maaseudun yhteisössä. Lisäksi kaupunkilaisen nimistössä virallista ja 
muutoin suunniteltua nimistöä on suhteessa enemmän kuin maaseu- 
dulla. Virallisten ja epävirallisten nimien käytön erot ja erilaiset käyttö- 
funktiot ovatkin kiinnostava kenttä selvitettäväksi. Slangiasuiset paikan- 
nimet voivat olla tyypillisiä enimmälti nuorille, ja niiden avulla voidaan 
erottautua esimerkiksi vanhemmista ikäryhmistä. Toisaalta joitakin 
slanginimiä voidaan käyttää hyvin yleisesti. Esimerkiksi Stadi (’Helsin- 
ki’), Lintsi ( Linnanmäki’) ja Aleksi (Aleksanterinkatu') tunnetaan laajalti 
muuallakin kuin Helsingissä, ja ne ovat jopa osa institutionaalista ja 
kaupallista kielenkäyttöä. Slanginimien käytön ja identiteetin kytköstä 
tarkastellaan luvussa 3.7. 

Sosiolingvistinen variaationanalyysi ei rajoitu vain paikannimistön 
tutkimukseen, vaikka sitä sillä saralla onkin eniten tehty. Samoin meto- 
dein voi tutkia muutakin nimistöä. 
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3.6. Nimet vuorovaikutuksessa 


Nimet kuuluvat keskeisenä osana arkiseen ja institutionaaliseen vuoro- 
vaikutukseen. Nimiä käytetään keskusteluissa viittaamaan henkilöihin, 
paikkoihin, tuotteisiin, tapahtumiin ja moniin muihin tarkoitteisiin. 
Keskustelussa samoihin kohteisiin voidaan viitata lukuisin eri tavoin, 
eikä viittaus välttämättä aina ole edes propri (esim. tyttö, tuo tyttö; kau- 
punginosa; vrt. Maija; Sörnäinen, Sörkkä). Keskusteluaineistojen ja kes- 
kusteluanalyysin käyttö (ks. Haastattelu aineistonkeruun metodina so- 


siolingvistiikassa; Keskustelunanalyysi ja vuorovaikutuslingvistiikka tk.) 
yhdistettynä nimistön tuntemukseen valottaakin proprien ja appellatii- 


vien välistä eroa ja rajapintaa. Tavoitteena on selvittää, millä eri tavoin 
keskusteluissa yksilöidään ja mitä tehtäviä yksilöivillä ilmauksilla on. 

Kun tutkitaan nimiä vuorovaikutuksessa, niitä tarkastellaan kielen 
aineksina osana kielen järjestelmää ja erityisesti yhteydessä siihen 
sosiaaliseen toimintaan, jota kielellä luodaan. Esimerkiksi arkikeskuste- 
luissa nimiä käytetään joustavasti muiden kielenainesten lomassa, eikä 
ole välttämättä mielekästä tarkastella propreja ennalta annettuna kate- 
goriana erillään muista viittaamiseen käytetyistä kielenaineksista varsin- 
kaan, kun ilmauksen proprisuus tai appellatiivisuus selviää usein vasta 
kontekstista (vrt. luku 1.). Olennaista on viittaaminen, yhteisten referent- 
tien luominen keskusteluun ja ne toiminnot, joiden osana viittaaminen 
tehdään. Kysymys nimien käytöstä kytkeytyy laajemmin tarkoitteisiin 
viittaamiseen ja kysymyksiin siitä, millaista tunnistamista ja yhteisyyt- 
tä keskustelijat tarvitsevat tai tavoittelevat. Tällaista tutkimusta on teh- 
ty suomalaisista keskusteluista ennen muuta pronomini-viittauksista 
(esim. Seppänen 1998; Etelämäki 2006). Keskustelunanalyyttista tutki- 
musta henkilöihin ja paikkoihin viittaamisesta nimiä käyttäen on tehty 
jonkin verran muista kielistä (esim. Enfield & Stivers 2007), mutta suo- 
men kielestä tällaista tutkimusta on toistaiseksi hyvin vähän. 

Nimien käyttö ja suhtautuminen nimiin on hyvin kulttuurisidonnais- 
ta, ja olemassa oleva tutkimus muista kulttuureista tarjoaa kiinnostavan 
mahdollisuuden vertailuihin. Nimien käyttö voi esimerkiksi heijastaa 
valtarakenteita: henkilöitä ei välttämättä kaikissa tilanteissa identifioida 
heidän omalla nimellään vaan suhteessa muihin ihmisiin (esim. Matti 
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Virtasen rouva). Nimien käytöllä voi myös korostaa itseään, liittää arvos- 
tetuiksi ajateltuja ihmisiä tai paikkoja omaan lähipiiriinsä (ns. nimien 
pudottelu). 

Nimet voivat joskus nousta keskusteluissa myös puheenaiheeksi, jol- 
loin keskustelijat kommentoivat nimiä ja niihin liittämiään käsityksiä 
ja merkityksiä. Tällainen metalingvistinen nimien käyttö on myös kiin- 
nostava tutkimuskohde. Varsinkin haastattelupuheessa tällaista puhet- 
ta voi olla paljon. Nimiin liitettyjä merkityksiä tarkastellaan erityisesti 
kansanonomastiikassa. 


3.7. Kansanonomastiikka 


Kun tutkitaan sitä, millaisia käsityksiä ja havaintoja maallikoilla (ei- 
kielentutkijoilla) on nimistä ja nimistönkäytöstä, tehdään kansan- 
onomastista tutkimusta. Voidaan puhua myös kansanlingvistisestä 
nimistöntutkimuksesta. Nimiä koskeva puhe kohdistuu joko itse nimiin 
ja nimielementteihin (metakieli 1) tai nimienkäyttöön ja nimenkäyttä- 
jün liittyviin uskomuksiin (metakieli 2). Nimenkäyttäjä voi luonnehtia 
jotakin nimeä (esim. Juhannusruusunkuja) vaikka ihanaksi tai suloiseksi 
(metakieli 1) mutta samalla todeta, että ”sekaisinhan niis ruusuis me- 
nee” viitaten siihen, että alueella on muitakin ruusujen mukaan nimet- 
tyjä katuja (metakieli 2). Edelliset luonnehdinnat kohdistuvat siis nimen 
leksikaaliseen tai muuhun kielelliseen sisältöön ja ulkoasuun (nimet 
sellaisinaan), jälkimmäiset nimen käytettävyyteen (nimet välineinä). 
Tyypillistä aineistoa kansanonomastiselle tutkimukselle ovat 
haastattelu- ja keskusteluaineistot. Keskustelut voivat olla myös verkko- 
keskusteluja. Kyselylomakkeilla voidaan puolestaan saada nopeasti suu- 
rehkojakin aineistoja. Kun kielenkäyttäjät raportoivat omasta tai muiden 
nimistönkäytöstä, he tulevat samalla myös esittäneeksi käsityksiään sii- 
tä, miten he itse tai muut tutkituista kohteista puhuvat. Joskus rapor- 
toitu käyttö voi olla ristiriidassa todellisen, spontaanin käytön kanssa. 
Moni voi esimerkiksi ilmoittaa käyttävänsä slangipaikannimeä (esim. 
Stadi), mutta todellisuudessa virallinen nimi (Helsinki) voi olla taa- 
jemmin käytössä. Tällöin raportoidulla käytöllä kuvataan ensisijaisesti 
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identifioitumista jonkin ryhmän jäseneksi tai ilmennetään tiettyä iden- 
titeettiä. (Ks. esim. Ainiala & Lappalainen 2010.) 

Kansanonomastinen lähestymistapa antaa tutkijalle monipuolista 
tietoa myös siitä, millaisia mielikuvia ja merkityksiä nimille annetaan 
ja millaisia asenteita niihin liitetään. Vastaajalla voi olla käytössään val- 
miita vaihtoehtoja, esimerkiksi erilaisia adjektiiveja (esim. miellyttävä 
— epämiellyttävä, vanhanaikainen — nuorekas, urbaani — maalainen, 
maskuliinen — feminiininen), joita hän liittää kysyttyihin nimiin. Verk- 
kokeskustelut taas tarjoavat aineistoja, joissa keskustellaan monesti 
tunnepitoisestikin esimerkiksi erilaisista etunimistä tai yritysnimistä ja 
tuodaan esiin näihin nimiin kytkettyjä asenteita ja mielikuvia. Keskus- 
telijoilla voi myös olla omia käsitteitä tai kategorisointeja nimille (esim. 
”lähiönimi”, ”mummonim?”). Tutkija pääsee silloin paneutumaan siihen, 
millaisiin nimiin tällaisia kategorisointeja kohdistetaan ja millä tavoin 
perustellen. Tutkimus voi näin saada myös diskurssianalyyttisia piirteitä. 


3.8. Tekstianalyyttinen ja diskurssianalyyttinen metodi 


Nimillä on yksilöivän tehtävänsä lisäksi monia muitakin tehtäviä. Nämä 
voivat liittyä tekstin tehtäviin ja esimerkiksi tukea tekstin lajiominai- 
suuksia. Nimiä voi teksteissä tutkia esimerkiksi selvittämällä niiden nar- 
ratiivista funktiota (mikä on nimien osuus tekstin ja tarinan kerronnas- 
sa), affektiivista funktiota (miten nimet heijastavat erilaisia tunnetiloja ja 
luovat tekstin tunneilmastoa) tai ideologista funktiota (miten nimi tukee 
tai rakentaa tekstin ideologista sanomaa). 

Erilaisissa teksteissä ja tekstilajeissa yksilöitäviin kohteisiin voidaan 
viitata monin eri tavoin. Jos esimerkiksi lehdistötiedotteissa käyte- 
tään epävirallisia nimiä (esim. Kaivari, Espa) virallisten (Kaivopuisto, 
Esplanadinpuisto) sijaan, esitetään myös paikkoihin liitettävät tapahtu- 
mat epävirallisina ja luodaan läheistä ja tuttavallista vaikutelmaa. 

Henkilöihin voidaan teksteissä viitata proprin tai appellatiivin sisäl- 
tävällä NP:llä. Pelkän etunimen käyttö osoittaa usein tuttavallisuutta ja 
läheisyyttä. Fi-propriset nimitykset puolestaan ovat tavallisia joissakin 
uutistyypeissä (onnettomuuksista, rikoksista yms. kertovissa), joissa 
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viitataan toimijoihin mainitsemalla esimerkiksi henkilön ikä ja suku- 
puoli (vuonna 1986 syntynyt mies). 

Varsinkin kaunokirjallisuudessa nimillä on narratiivinen, tarinan ker- 
rontaan liittyvä tehtävä. Nimet ovat vuorovaikutuksessa muiden teoksen 
sisältöä rakentavien ja tarinaa kuljettavien elementtien kanssa. Nimellä 
voi kaunokirjallisuudessa olla monia muitakin tehtäviä; nimi voi sisältää 
esimerkiksi erilaista henkilöä luonnehtivaa tai muuten teoksen sisältöön 
liittyvää informaatiota. Nimen avulla henkilö voidaan myös kytkeä tiet- 
tyyn ajankohtaan tai paikkaan. 

Retoriselta kannalta kiinnostavaa on ylipäätään se, mitä nimiä teks- 
tiin on valittu ja miten niitä käytetään, kuinka paljon ja millä tavoin niitä 
nostetaan esiin ja millaisia ne ovat. Esimerkiksi mainostekstissä tuot- 
teen nimi voi osoittautua keskeiseksi lukijaan vaikuttamisen keinoksi. 
Muissa tekstilajeissa luonnollistuneista puhetavoista voi kertoa myös 
esimerkiksi se, käytetäänkö etunimiä, sukunimiä, näiden yhdistelmiä 
vai epävirallisia nimiä ja mitä määritteitä nimiin lisätään. Diskurssien 
rakentumista voi siis tutkia myös proprien kautta (vrt. Diskurssiana- 


lyysi tk.). Kun tutkitaan nimiä diskursseissa, voidaan kysyä, millaisia 
ideologisia funktiota nimillä on. Kriittinen onomastiikka pyrkii paljas- 
tamaan, miten nimet palvelevat vallankäyttöä. Tällaisiin kysymyksiin 
pureudutaan usein myös nimimaisematutkimuksessa. 


3.9. Nimimaisematutkimus ja multimodaalinen analyysi 


Tieteenalaa, jossa tutkitaan julkisessa tilassa näkyviä kieliä ja eri kielten 
suhdetta toisiinsa, kutsutaan kielimaisematutkimukseksi. Tällaisen tutki- 
muksen avulla voidaan selvittää, miten tilaa rakennetaan ja millaisia 
sosiaalisia ja poliittisia suhteita julkiset tilat ilmentävät. Hyvin suuri osa 
jokapäiväisessä ympäristössämme näkyvistä kielellisistä ilmauksista on 
erisnimiä: tienviitoissa ja katukylteissä on paikannimiä, mainostauluissa ja 
liiketiloissa yritysten ja brändien nimiä, rakennusten seinissä koulujen ja 
hallintoelinten nimiä. Siksi onomastiikan näkökulmat ovat kielimaisema- 
tutkimukselle arvokkaita. Kun keskitytään propreihin, voidaan puhua 
nimimaisematutkimuksesta. (Ks. myös Puzey 2016; Syrjälä 2018.) 
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Nimimaisematutkimus vaatii kenttätyötä. Aineisto kerätään valo- 
kuvaamalla esimerkiksi jonkin alueen kaikki kadunnimikyltit tai liike- 
huoneistojen seinillä, ovissa ja ikkunoissa olevat tekstit. Nimimaisema- 
tutkijan mielenkiinto kohdistuu usein siihen, millainen asema 
vähemmistökielillä on julkisessa tilassa. Hän voi esimerkiksi selvittää, 
kuinka paljon ja mitä gaelinkielisiä nimiä näkyy Skotlannin maanteiden 
varsilla ja missä järjestyksessä gaelin- ja englanninkieliset nimet esite- 
tään. Todellista tilannetta voidaan sitten verrata siihen, mitä vallanpitäjät 
väittävät kielipolitiikasta. Näin nimimaisematutkimus on samalla kriit- 
tistä onomastiikkaa, jonka tavoitteena on paljastaa piileviä valtaraken- 
teita ja asenteita. 

Julkisessa tilassa näkyvät kaupalliset nimet tarjoavat tutkijalle myös 
muunlaisia näkökulmia. Eri kielten esiintyminen kauppojen nimi- 
kylteissä voi kertoa esimerkiksi kaupungin asuinalueen monikielisyy- 
destä, mutta kielivalinnat voivat välittää myös kaupallisia merkityk- 
siä, jotka eivät ole tulkittavissa nimeen sisältyvistä sanoista itsestään: 
ranskankielisillä nimillä rakennetaan erilaista mielikuvaa kuin italian- 
tai englanninkielisillä nimillä. Kaupallisille nimille kielen elementit ovat 
yleensä vain yksi mielikuvia välittävä keino. Nimiin sisältyvien sanojen 
ja muiden kielen elementtien lisäksi niiden merkitykset muodostuvat 
myös muista semioottisista resursseista, kuten nimen koosta, kirjainten 
muodosta ja väristä tai nimen liikkumisesta. Kaupallisen nimimaise- 
man tutkimisessa on mahdollista hyödyntää multimodaalista analyysia 
(esim. Kress & van Leeuwen 2001). 


3.10. Suuret korpukset ja niiden määrällinen analyysi 


Nimistöntutkijalla on pääsy moniin laajoihin korpuksiin. Kaikkien suo- 
malaisten viralliset henkilönnimet ovat käytettävissä Väestörekisteri- 
keskuksessa, ja mittava, 2,7 miljoonan nimen kokoelma perinnäisiä 
paikannimiä on puolestaan digitaalisessa Nimiarkistossa sekä Maan- 
mittauslaitoksen Paikannimirekisterin ja Nimiarkiston aineiston sisäl- 
tävässä Nimisammossa*. Rekisteröidyt kaupalliset nimet ovat saatavissa 
Patentti- ja rekisterihallituksesta, ja esimerkiksi monia eläinten (hevoset, 
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koirat ym.) virallisia nimiä on omissa rekistereissään. Internetin nimis- 
töä on niin ikään suurina korpuksina tutkittavaksi. 

Henkilönnimikorpukset tarjoavat mahdollisuuden tutkia muiden 
muassa nimien suosionvaihtelua ja eri nimien ja nimityyppien jakautu- 
mista. Etunimien suosionvaihtelua on tutkittu, kuten muidenkin kult- 
tuuristen innovaatioiden leviämistä, käyttäen hyväksi E. M. Rogersin 
luomaa diffuusiotutkimuksen käsitettä ja metodia. Siinä uusien il- 
miöiden leviämistä tarkastellaan sekä sosiologiselta että maantieteelli- 
seltä kannalta. Etunimistön osalta on saatu selville, että pääosa nimis- 
tä noudattaa leviämisessään samankaltaista suosiokäyrää, jossa nimi 
nousee määrällisesti suosionsa huipulle ja sitten suosio laskee. Yleensä 
nimi tulee uudelleen suosituksi noin sata vuotta ensimmäisen suosion- 
sa jälkeen. Uusien nimien suosio nousee usein jyrkemmin ja korkeam- 
malle kuin perinteisten nimien. (Ks. esim. Kiviniemi 2006.) 

Suomalaisten sukunimet sisältyvät niin ikään Väestörekisteri- 
keskuksen aineistoihin. Samalla tavoin kuin etunimistä myös suku- 
nimistä voidaan tutkia eri nimien yleisyyttä ja esimerkiksi alueellista 
jakautumista. Myös eri nimityyppien (kantasanatyyppiset, yhdyssana- 
tyyppiset ja johtimelliset sukunimet) osuuksia eri aikakausina voidaan 
tutkia. On saatu selville muun muassa, että johtimellisia nimiä on 40 % 
kaikista suomalaisista sukunimistä, mutta niiden kantajia on jopa 62 % 
suomalaisten sukunimien kantajista. 

Digitaalinen nimiarkisto sisältää noin 2,7 miljoonaa Suomesta ja 
Suomen lähialueilta kerättyä paikannimeä, joihin sisältyy myös kartta- 
tieto, eli käyttäjä näkee kartalta, missä paikat sijaitsevat. Aineiston avulla 
voidaan tutkia esimerkiksi eri nimien ja nimielementtien esiintymistä 
ja levikkejä. Esiin saadaan tietoja vaikkapa siitä, missä ja millaisissa ni- 
missä esiintyy perusosana -töyry tai -stO-suffiksi. 

Internetin erilaiset nimistöt tarjoavat monipuolisia tutkimus- 
mahdollisuuksia. Tilastollisia menetelmiä apuna käyttäen voidaan tutkia 
vaikkapa käyttäjänimien yleisiä piirteitä eri verkkoyhteisöissä. Tiedon- 
louhintaa, todennäköisyyslaskentaa ja tilastollisia analyyseja on käyttänyt 
metodeinaan esimerkiksi Antti Leino (2007) tutkiessaan Maanmittaus- 
laitoksen paikannimirekisteristä poimimiensa 58 ooo suomalaisen jär- 
vennimen perusteella nimeämismalleja ja nimianalogioita. 
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4. Yhteenveto 


Proprit on sanaluokka, joka sisältää rakenteeltaan ja semanttiselta sisäl- 
löltään monenkirjavan joukon erilaisiin tarkoitteisiin viittaavia ilmauk- 
sia. Siksi proprien tutkimus ei voi tukeutua vain yhteen metodiin, vaan 
menetelmä on valittava tutkimuksen kohteen, tutkimusnäkökulman ja 
tutkimustavoitteiden mukaisesti. Perinteisesti suomalaisessa onomastii- 
kassa on tutkittu paikannimien typologiaa ja alkuperää ja tutkimukseen 
on sovellettu syntaktis-semanttista ja leksikaalis-etymologista metodia, 
mutta viime vuosikymmeninä nimistöntutkijat ovat ryhtyneet tarkastele- 
maan kohdettaan useammista eri näkökulmista ja yhä enemmän osana 
koko kielijärjestelmää. Sen vuoksi nimistöntutkimukseen on mahdollis- 
ta soveltaa monia yleisiä kielitieteen menetelmiä, kuten haastattelututki- 
muksia, variaatioanalyysia, kansanlingvistiikkaa, vuorovaikutusanalyysia 
tai kriittistä diskurssianalyysia. 

Olemme edellä esittäneet mielestämme keskeisimmät nimistöntutki- 
joiden nykyään käyttämät metodit. Usein tutkijat myös yhdistelevät eri 
metodeja saadakseen kattavan kuvan omasta tutkimuskohteestaan. Fpäi- 
lemättä metodeja on olemassa muitakin, ja uusien kielen teorioiden, 
tutkimusasetelmien, tutkimuskohteiden ja tarkastelukulmien myötä 
tutkijoille tarjoutuu yhä uusia tapoja proprien tarkasteluun. Luultavasti 
onomastiikka kytkeytyy tulevaisuudessa yhä kiinteämmin myös kieli- 
opin tutkimukseen ja tuo näin proprit muiden sanojen rinnalle tasa- 
vertaiseksi osaksi kielijärjestelmää. 


Aiheesta lisää: 
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VIITTEET 
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Mikä? 


Tekstintutkimus hakee systemaattista ymmärrystä siitä, millaisia kir- 
joitetut tekstit ovat ja miksi ne ovat sellaisia kuin ovat. Se tuottaa tie- 
toa sanaston ja kieliopin käytöstä teksteissä, tekstien rakenteista ja 
jäsentelytekniikoista sekä keinoista tuottaa tilanteista vuorovaikutusta 
ja muodostaa yhteyksiä paitsi toisiin teksteihin myös yhteiskuntaan ja 
kulttuuriin laajemmin. Tekstejä tutkitaan sekä tuotoksina että proses- 
seina huomioiden toisaalta staattiset piirteet (esim. kokonaisjäsentely), 
toisaalta dynaamiset, tekstin edetessä kehittyvät piirteet (esim. teeman- 
ja informaationkulku). Tekstien tutkiminen on tärkeää, sillä jälkiteolliset 
yhteiskunnat toimivat pitkälti kirjoitettujen tekstien varassa. Tekstin- 
tutkimuksen keskeinen menetelmä on tekstianalyysi. Lisäksi voidaan 
hyödyntää esimerkiksi haastattelu- ja havainnointimenetelmiä. 


Katso myös: 


Luku 5 Lingvistinen etnografia toimintayhteisöissä 
Luku 6 Diskurssianalyysi 


Luku 22 Keskustelunanalyysi ja vuorovaikutuslingvistiikka 
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1. Johdanto 


Tekstintutkimus hakee systemaattista ymmärrystä siitä, millaisia eten- 
kin kirjoitetut tekstit ovat ja miksi ne ovat sellaisia kuin ovat. Vaikka 
kirjoitettuja tekstejä on lukuisia erilaisia, yhdistävä tekijä on esinemäi- 
nen ja (enemmän tai vähemmän) staattinen olomuoto. Fysikaalisilta 
ominaisuuksiltaan kirjoitetut tekstit ovat valoa heijastavia pintoja, jotka 
sisältävät kirjoitusmerkeiksi tulkittavia muste-, pikseli- tai muita kuvioi- 
ta ja niiden yhdistelmiä. Tekstin merkitys syntyy, kun lukija yhdistää 
merkit ja niiden yhdistelminä muodostuvat rakenteet tekstiä ympäröi- 
vään kontekstiin. Myös konteksti on osa merkitystä, ja sekin syntyy vasta 
lukijan tulkinnassa. Ennen kuin merkit tavoittavat tulkitsijan ja saavat 
tulkinnan, paperilappu tai näyttöpääte ruutunäkymineen ei kuitenkaan 
ole esinettä kummempi. 

Kirjoitettujen tekstien kulttuurisesti ja historiallisesti merkittävinä 
ominaisuuksina voi mainita ainakin esinemäisyyden, säilyvyyden, siir- 
rettävyyden, monistettavuuden ja näkyvyyden. Tekstien tutkiminen on 
tärkeää, sillä jälkiteolliset yhteiskunnat toimivat pitkälti kirjoitettujen 
tekstien varassa: teksteillä muun muassa dokumentoidaan, tehdään 
sitovia päätöksiä, opetetaan, analysoidaan, vakiinnutetaan käsityksiä, 
kommunikoidaan ajan ja paikan yli (toisinaan anonyymistikin), mainos- 
tetaan sekä vaikutetaan julkisessa tilassa mielipiteisiin ja mielikuviin. 
Tekstit ja tekstien tuottaminen ovat tulleet osaksi lähes kaikenlaista työtä 
(Heikkinen, Hiidenmaa & Tiililä 2001; Johansson, Nuolijärvi & Pyykkö 
2011; Tiililä & Karvinen 2017). Etenkin asiantuntijatyössä tekstit ovat jo 
pitkään olleet erottamaton osa itse työtä — sekä lähtökohtana, tuloksena 
että työskentelymuotona (Hiidenmaa 2001; ks. myös Lehtinen & Pälli 
2016; Mikkola 2016). Tietoisten toimien lisäksi yhteisöt tulevat rakenta- 
neeksi teksteillä ajattelutapojaan, asenteitaan ja näkökulmiaan. 

Useimmat tekstin merkityksen kannalta kiinnostavat ilmiöt toteutu- 
vat tekstikokonaisuudessa kaikkien tekstissä hyödynnettyjen kielellisten 
ja tekstuaalisten keinojen yhteisvaikutuksena. Halutessaan tutkija voi 
poimia lähes loputtomiin kiinnostavia huomioita mistä tekstistä tahansa 
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ja koota niistä kiehtovan esityksen. Tämä ei kuitenkaan ole tutkimusta. 
Tieteellisen tutkimuksen tehtävänä on muodostaa systemaattisia kysy- 
myksiä ja perustella niiden mielekkyys aiemman tutkimuksen ja teo- 
reettisten lähtökohtien avulla. Tekstintutkimuksen tavoitteeksi ei riitä 
tekstin sisällön selostaminen ja esitystavan parafrasoiminen. Aineiston 
havainnot on kuvattava tarkoituksenmukaisesti valituin tekstianalyytti- 
sin käsittein, ja lopuksi on tulkittava havainnot kontekstissaan. Jokainen 
analyysi on samalla oppisuunnan teoreettisten lähtökohtien koettelua 
— vankistamista tai horjuttamista. Tekstintutkimuksen panos kielen- 
tutkimukseen on lisätä ymmärrystä varsinkin kirjoitetusta kielestä so- 
siaalisen kanssakäymisen välineenä. 

Laajasti määriteltynä tekstillä tarkoitetaan sosiaalista ja semioottista 
eli sosiosemioottista kokonaisuutta. Tekstin sosiaalisuudella tarkoite- 
taan yhtäältä näkemystä siitä, että ihmisyhteisöihin ja -kulttuureihin on 
vakiintunut tunnistettavia (mutta varioivia ja ajan mittaan muuttuvia) 
esitystapoja, rakennekaavoja ja puhetapoja, joita hyödynnetään sekä 
tekstien tuottamisessa että tulkinnassa. Toisaalta tarkoitetaan sitä, että 
jokainen teksti kiinnittyy lukuisiin aikaisempiin teksteihin vastaamalla 
niihin, kommentoimalla niitä, toistamalla tai kyseenalaistamalla niiden 
konventioita — ja niin edelleen. Olennaista on, että teksti ymmärretään 
kielenkäytön, ei kieliopin yksiköksi: teksti on sosiaalisen kanssakäymi- 
sen kokonaisuus, joka voi toteutua niin yhtenä virkkeenä (esim. lappuna 
Palaan pian!) kuin tuhatsivuisena romaanina tai päivästä toiseen jatku- 
vina hallitusneuvotteluina (ks. Halliday & Hasan 1976, 1). 

Tekstin semioottisuus tarkoittaa puolestaan sitä, että teksti on vähin- 
tään yhteen merkkijärjestelmään tukeutuva ja sen puitteissa tulkitta- 
va merkityskokonaisuus. Näin tarkasteltuna teksti voi olla yhtä hyvin 
puhuttu kuin kirjoitettu kokonaisuus. Se voi olla myös ei-kielellinen 
kokonaisuus, esimerkiksi liikennemerkki, kuva tai tanssiesitys. Jos 
teksti yhdistelee eri merkkijärjestelmiä, puhutaan multimodaalisesta 
tai -semioottisesta tekstistä (esim. Kress 2009; Bateman, Wildfeuer & 
Hiippala 2017). Teksti voi toteutua yhteistoiminnallisesti vuoropuheluna 
(esim. kasvokkaiskeskusteluna tai pikaviestittelynä), tai se voi olla alus- 
ta loppuun yhden osallistujan tai osallistujatahon itsenäisesti tuottama 
(esim. uutisjuttu, karhukirje). 
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Tämän kokoelman tarpeisiin määrittelemme tekstin edellistä hie- 
man suppeammin: tarkoitamme tekstillä tyypillistä lineaarisesti etene- 
vää kirjoitettua tekstiä, joka ei toteudu vuoropuheluna, ja huomiomme 
koskevat ennen muuta tällaisten tekstien tutkimusta.' Keskitymme kir- 
joitettujen tekstien lingvistiseen analyysiin ja sivuutamme multimodaa- 
lisuuden. Tiedämme toki, että mikään teksti ei ole monomodaalinen, 
pelkästään kielellinen olio, vaan jokaisessa tekstissä on tehty vähintään- 
kin myös tekstin ulkoasua koskevia valintoja: on aseteltu teksti tietyllä 
tavoin ja tuotettu kirjoitusmerkit tietyn asuisina. 

Lingvistisesti tekstintutkimuksen tiedonintressi on kahtalainen: 
yhtäältä kiinnostus on siinä, miten kieli toimii tekstimerkitysten tuot- 
tamisessa, toisaalta siinä, millaisia merkityksiä tietyissä teksteissä 
ja konteksteissa tuotetaan ja miten (ks. Hiidenmaa 2000, 184-185). 
Tekstintutkimuksen olennainen menetelmä on laadullinen tekstianalyy- 
si, johon myös kirjoituksemme keskittyy. Täydentäviä menetelmiä ovat 
esimerkiksi kirjoittajien ja lukijoiden sekä muiden tahojen haastattelut 
ja havainnoinnit. 

Tekstintutkimuksen kanssa osin limittäinen tutkimusala on 
diskurssintutkimus (engl. discourse studies; ks. Diskurssianalyysi tässä 


kirjassa). Alojen erottaminen toisistaan on jopa jossain määrin väki- 
näistä, eikä englanninkielisessä tutkimuskirjallisuudessa monestikaan 
tehdä vastaavaa jakoa. Onkin kiinnostavaa sinänsä, kuinka tekstin- 
tutkimus on suomalaisessa ja ehkä yleisemminkin pohjoismaisessa 
kielentutkimuksessa kehittynyt omaksi tutkimusalakseen (vrt. esim. 
Ruotsissa textforskning). Vaikka sekä tekstintutkimus että diskurssin- 
tutkimus tarkastelevat tekstejä ja niiden kontekstuaalisia — tilanteisia, 
yhteiskunnallisia ja kulttuurisia — merkityksiä, diskurssintutkimuk- 
sessa korostuu selvemmin tekstien yhteisöllinen tai yhteiskunnallinen 
luonne ja siten usein myös vallan ja ideologisten käytänteiden kriitti- 
nen analyysi (ks. Fairclough 2010) ja toisinaan myös pyrkimys positiivi- 
sen muutoksen aikaansaamiseen (ks. Bartlett 2017). Käytännössä rajat 
ovat kuitenkin häilyvät, ja suomalaistutkijat käyttävät toisinaan rinnas- 
tusta tekstin- ja diskurssintutkimus. Diskurssintutkimuksen kohteena 
voivat olla kirjoitettujen tekstien ohella myös kasvokkaiset keskustelut 
(ks. Diskurssianalyysi tk.). 
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Artikkelimme jasentyy seuraavasti. Ensin luomme katsauksen 
tekstintutkimuksen historiaan (luku 2) ja esittelemme tekstintutkimuk- 
sen metodologisia lähtökohtia yleisellä tasolla (luku 3). Osa-alueina ovat 
laadullisuus ja määrällisyys, ongelmanasettelu ja aineiston koostami- 
nen. Tämän jälkeen esittelemme analyysimenetelmiä erityyppisissä tut- 
kimusasetelmissa (luku 4). Lopuksi tarkastelemme tekstintutkimuksen 
nykykenttää ja ajankohtaisia kysymyksiä (luku 5). Tutkimusesimerkeissä 
olemme painottaneet omalla oppialallamme fennistiikassa eli suomen 
kielen tutkimuksessa tehtyä tutkimusta, jonka valtavirtaa voi luonnehtia 
konstruktivistiseksi: kiinnostus on siinä, kuinka kirjoitetuissa teksteissä 
tuotetaan merkityksiä ja rakennetaan todellisuutta koskevia käsityksiä 
(konstruktivismista ks. Berger & Luckmann 1994 [1966]; myös Pieti- 
käinen & Mäntynen 2019).? 


2. Tekstintutkimuksen historiaa 


Nykyisen tekstintutkimuksen historia ei ole yksinkertainen kirjoitettava, 
koska kehityslinjoja ja vaikutteiden antajia on useita. Tekstinäkökulmat 
ovat tulleet vakiintuneeksi osaksi eri kieliaineita eri polkujen kautta. 
Polut ja lopputulemat ovat erilaisia sen mukaan, miten tekstintutkijat 
ovat yhdistelleet retoriikan, filologian ja strukturalistisen kielentutki- 
muksen perinnettä (ks. myös Kalliokoski 1996a, 24-30). 

Koko ihmistieteiden kentän kannalta merkittävää oli se, että 
1960-luvulla Berger ja Luckmann (1994 [1966]) muotoilivat teorian to- 
dellisuuden sosiaalisesta rakentumisesta. Tämä sai monen tutkijan kiin- 
nostumaan kielestä ja teksteistä. Richard Rorty (1967) alkoikin kutsua 
tätä suuntausta kielelliseksi käänteeksi. Ajatus siis oli, että kielenkäyttö 
muovaa käsitystämme todellisuudesta ja siten kielen tarkastelu on avain 
todellisuuden tutkimukseen (ks. myös Kuortti, Mäntynen & Pietikäinen 
2008). Sitä mukaa kuin kielentutkijat ovat laventaneet tarkastelua pe- 
rinteisen kielentutkimuksen ydinalueelta eli äänne-, muoto- ja lauseo- 
pin sekä sanaston tarkastelusta merkitysten, ideologioiden, kontekstien 
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ja kulttuuristen käytänteiden tarkasteluun, keskustelukumppaneiksi 
on tullut esimerkiksi kulttuurintutkijoita, kasvatustieteilijöitä, antropo- 
logeja sekä yhteiskunnan tutkijoita. Näistä jokaiselle teksti on hieman 
omanlaisensa olio. Sen ohella, että lingvistit hakevat vastauksia tekstin ja 
tekstiyden olemukseen, etenkin kielentutkimuksen ulkopuolella kiinnos- 
tuksen kohteena on ollut tekstien kuljettama merkitys sisällön, erityisesti 
foucault'laisten diskurssien näkökulmasta (ks. Foucault 2005 [1969]).3 

Kielentutkijoiden kiinnostus diskurssiin, kielen käyttöön, syntyi 
monessa vaiheessa, joista voi mainita muun muassa seuraavat. De 
Saussure (2014 [1916]) erotti kielen ja sen käytön (ra. langue ja parole). 
Firth (1957 [1934—1950]) vakiinnutti käsitteen tilannekonteksti ja ohjasi 
etsimään merkitystä kielen tilannesidonnaisesta käytöstä. Myös Austin 
(2016 [1962]) ja Searle (1969) nostivat tarkasteluun kielellä toimimi- 
sen: kuinka kieltä käytetään asioiden tekemiseen. Labov ja Waletzky 
(1967) puolestaan kuvasivat suullisten henkiinjäämiskertomusten ra- 
kenteellisia ja kielellisiä konventioita ja inspiroivat monia tulevia teksti- 
lajitutkijoita. Hallidayn systeemis-funktionaalinen teoria oli ensimmäi- 
siä täysimittaisia teorioita kielen yhteisöllisestä ja vuorovaikutteisesta 
luonteesta. Erityisesti hänen teoksensa Language as social semiotic (1978) 
kehitteli Firthin ajatuksia kielen ja kontekstin suhteesta eteenpäin. Sa- 
moihin aikoihin myös Hymes (1972) siirsi huomion kieliopin sään- 
nöistä kielenkäytön sääntöihin toteamalla, että edelliset olisivat hyö- 
dyttömiä ilman jälkimmäisiä. Vaikka painotukset ovat muokkautuneet 
vuosikymmenten aikana, käsitteitä tilanne, konteksti, funktio, sosiaalinen 
toiminta, vuorovaikutteisuus, yhteisö, rekisteri ja tekstilaji hyödynnetään 
tekstintutkimuksessa tänäkin päivänä. 

Kielentutkimuksessa oli 1970-luvulle tultaessa syntynyt yhä voimak- 
kaampi kiinnostus kielenkäyttöä sekä kielen sosiaalista ja toiminnallista 
ulottuvuutta kohtaan. Autonominen ja rakennekeskeinen kielentutki- 
mus sai rinnalleen pragmatiikan, tekstien ja diskurssien tutkimuksen 
sekä keskustelunanalyysin. Suomessa kielentutkimus oli ollut kauan 
keskittyneenä äännehistoriaan, sananmuodostukseen ja lauseoppiin. 
Merkittävä muutos kohti tekstinäkökulmia tapahtui, kun Enkvist käy- 
tännössä toi tekstilingvistiikan Suomeen teoksellaan Tekstilingvistiikan 
peruskäsitteitä (1975). 
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Tässä tekstintutkimuksen varhaisvaiheessa — tekstilingvistiikassa — 
tutkittiin etenkin tekstinsisäisiä ilmiöitä, kuten koheesiota ja teeman- ja 
informaationkulkua (ks. luku 4.1.). Lisäksi laadittiin tekstikielioppeja, 
joilla olisi saatu kieliopin sääntöjen tapaan kuvatuksi, miten tekstit ra- 
kentuvat ja etenevät alusta loppuun (ks. van Dijk 1972). Hieman myö- 
hemmin julkaistussa de Beaugranden ja Dresslerin (1981) oppikirjassa 
Introduction to text linguistics käsiteltiin myös tekstuaalisuuden kulttuu- 
risia ja intertekstuaalisia ulottuvuuksia. 

Vaikka tekstilingvistiikka oli pitkälti laadullista tutkimusta, Enkvis- 
tin johtama tutkimusyksikkö ja varsinkin sen jatkohanke Suomen kie- 
len kvantitatiivista tekstisyntaksia (Hakulinen, Karlsson & Vilkuna 1980) 
hyödynsivät myös määrällisiä menetelmiä tekstipiirteiden kuvauksessa. 
Tuolloin tietokoneiden yleistyminen tarjosi ylipäätään mahdollisuuksia 
isojen tekstiaineistojen laskennalliseen käsittelyyn, minkä osoitus on 
myös Saukkosen (1984) kuvaus Mistä tyyli syntyy?. Teoksessa esitelty 
määrällinen tutkimus hyödynsi monimuuttujaisia dimensioita (esim. 
abstrakti-konkreettinen, objektiivinen-subjektiivinen) tekstien kielel- 
listen piirteiden stilistiseen analyysiin (vrt. Biber 1988). 

Varhaisen tekstilingvistiikan klassikoihin lukeutuu myös Werlichin 
teos Typologie der Texte (1975), jossa esitellyt tekstityypit (narratiivinen, 
deskriptiivinen, ekspositorinen, argumentoiva ja instruktiivinen) ovat 
yhä alkeiskurssien vakiosisältöä. Werlichin typologia elää käytännön 
sovelluksena myös Pisa-kokeiden aineistoissa, sillä koetekstit valitaan 
siten, että ne edustavat mahdollisimman hyvin Werlichin luokkien mu- 
kaisia tekstejä. Typologiaa on sovellettu ahkerasti myös fennistiikassa 
(esim. Hakulinen 1982; Kauppinen & Laurinen 1984; Juvonen 2014). 

Tekstilingvistiikalla oli aluksi soveltavan kielentutkimuksen leima: 
jo Enkvistin (1975) kirjan syntysanat lausuttiin Suomen soveltavan 
kielitieteen yhdistyksen AFinLAn kokouksessa, ja kirjoittaja itsekin 
hahmottelee kirjasessaan sovelluksia äidinkielen ja vieraiden kielten 
opetuksesta tekoälyn tutkimukseen (mts. 119-128). Tekstinäkökulmat 
saivat heti vauhtia muissakin sovelluksissa. Esimerkiksi Esko Koivu- 
salon ja Liisa Huovinen-Nybergin kielenhuolto-oppaassa Selkeä virka- 
kieli (1978) hyödynnettiin teema-reema-rakennetta ja tekstityyppien 
luokittelua. 
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1980-1990-luvuilla huomio siirtyi tekstipinnan rakenteellisesta tar- 
kastelusta tekstin merkityksiin ja funktioihin, ja kielenkäytön kontekstit 
ja instituutiot nousivat keskeisiksi. Tärkeä käänne oli kielen sosiaalisuut- 
ta ja merkitysten kontekstuaalisuutta kuvaavien kieliteorioiden esiin- 
marssi. Systeemis-funktionaalinen kielioppi ja siitä ponnistava tekstin- 
ja diskurssintutkimus voimistuivat Suomessa sen jälkeen, kun alan 
maailmankongressi järjestettiin Helsingissä 1989. Myös genretutkimus 
alkoi yleistyä. Fennistiikassa tutkimuksen kohteita olivat muun muassa 
koulun ja oppimisen tekstit (Kauppinen & Laurinen 1984; Karvonen 
1995) sekä kieli ja valta ja mediatekstien ideologisuus (Kalliokoski 
1996b; Heikkinen 1999). 

2000-luvulla tekstianalyysia on enenevästi tuettu ja laajennettu tut- 
kimalla myös tekstien tuottamisen ja tulkinnan olosuhteita ja käytän- 
teitä. Tällöin on siirrytty tekstikeskeisestä tutkimuksesta askel lähem- 
mäs kirjoittaja- ja lukijakeskeistä, etnografista tutkimusta (vrt. Lillis 
2013; Hyland 2015). Tämä edellyttää osallistujien haastattelemista, ky- 
selyjen tekemistä tai esimerkiksi tilanteiden havainnointia (ks. esim. 
Makkonen-Craig 2005; Tiililä 2007; Tiittula 2012). Lisäksi tutkijaluentaa 
teksteistä on toisinaan täydennetty keräämällä oheisaineistoksi tutkit- 
tavaa yhteisöä edustavien lukijoiden tulkintoja eli hyödyntämällä niin 
sanottua reseptioanalyysia (ks. Rahtu 2012; vrt. Visakko 2015; Tainio 
& Karvonen 2015). Lukemista ja kirjoittamista voidaan lähestyä myös 
kognitiivisesta ja psykolingvistisestä näkökulmasta (esim. Sanders, 
Schilperood & Spooren 2001; Kaakinen & Hyönä 2012). 

Olemme kuvanneet tekstintutkimuksen historian kehityskulkuna, 
jossa tutkimuskohde lavenee rakenteista käyttöön, muodosta merkityk- 
siin, merkityksistä toimintaan, teksteistä instituutioihin ja kulttuurisiin 
käytänteisiin. Tämä kuvaus on luonnollisesti siloteltu ja yksinkertais- 
tettu, mutta tällaisenaankin se vakuuttanee lukijan siitä, että tekstien 
tutkimuksella on pitkä ja polveileva traditio ja että monien näkökulmien 
ytimestä löytyy yhtenäinen kiinteä ydin, kieli autenttisissa tilanteissa 
palvelemassa osallistujien sosiaalisia tavoitteita. 
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3. Tekstintutkimuksen metodisia lähtökohtia 
3.1. Laadullista vai määrällistä tutkimusta 


Menetelmällisesti tekstintutkimuksen ydintä on laadullinen teksti- 
analyysi, joka nojaa empiriaan eli konkreettisista tekstiesiintymistä teh- 
tyihin havaintoihin erotuksena puhtaasti teoriaa, tutkimuksen lähtökoh- 
tia ja käsitteistöä pohtivalle tutkimukselle. Laadulliselle tutkimukselle 
ominaisesti tekstianalyysin kohteena ovat merkitykset (ks. Alasuutari 
2011 [1993]). Merkitysten ajatellaan rakentuvan kontekstuaalisesti, eikä 
tekstejä tarkastella itsenäisinä tai sulkeisina merkityskokonaisuuksina. 
Mäntynen on muotoillut asian niin, että ”[t]utkija voi kontekstin avulla 
'avata' tekstin merkityksen; tämän vuoksi kontekstin analysointi on ai- 
dosti osa tekstianalyysia” (Mäntynen 2003, 30-31). Tekstintutkijan teh- 
tävänä on tunnistaa tekstin antamat (yleensä hienovaraiset) vihjeet kon- 
teksteista ja perustella, että hänen osoittamansa kontekstit ovat oleellisia 
analysoitavien merkitysten kannalta. 

Konteksteja ei voi analysoida (eikä edes luetella) tyhjentävästi, vaan 
ne on huomioitava suhteessa tutkimuksen kysymyksenasetteluun. Po- 
tentiaalisia, analyysissa mahdollisesti olennaisia konteksteja ovat lokaalit 
eli tilanteiset kontekstit sekä globaalit eli kulttuuriset, yhteiskunnalliset 
ja historialliset kontekstit. Kontekstien ei ymmärretä olevan olemassa 
tekstistä irrallaan, vaan suhde nähdään kaksisuuntaiseksi: teksti paitsi 
nojaa konteksteihin samanaikaisesti myös rakentaa kuvaa siitä, millai- 
nen konteksti on. Riittävä kiinnittyminen globaaleihin konteksteihin on 
ehto sujuvalle ja ymmärrettävälle kommunikaatiolle etenkin julkisissa 
ja heterogeeniselle yleisölle suunnatuissa teksteissä (esim. media- ja 
viranomaistekstit). 

Tekstintutkimuksen kontekstuaalisesta analyysiotteesta seuraa, että 
tekstimerkitysten ei ymmärretä rakentuvan niinkään yksittäisissä sa- 
noissa ja rakenteissa vaan siinä, miten ne yhdessä kontekstoivat toi- 
siaan: vahvistavat tai kumoavat toistensa tulkintoja ja yhteispelinään 
muodostavat tilanteisesti ja kulttuurisesti ymmärrettäviä merkityk- 
siä ja toimintajaksoja. On myös hyvä pitää mielessä, että tekstiyhtey- 
den eli kotekstin (engl. co-text) näkökulmasta tekstin merkitykset ovat 
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dynaamisia eli kehittyviä ja muuttuvia: tulkinta edeltävästä tekstinosasta 
toimii kontekstina paraikaa tulkittavalle tekstinosalle, joka puolestaan 
rekontekstualisoi edeltävää joko vahvistamalla tai horjuttamalla sitä 


koskevaa aiempaa ymmärrystä (vrt. Keskustelunanalyysi ja vuorovaiku- 
tuslingvistiikka tk.). Samoin tekstin lajitulkinta voi muuttua lukemisen 


edetessä. Lisäksi genrejen ja kulttuuristen diskurssien eli puhetapojen 
”näkyminen” tutkittavassa tekstissä on tietenkin suhteellista: jos tutkija 
ei tunne tiettyä genreä tai diskurssia, hän ei voi myöskään havaita sen 
toteutumista kielenkäytössä. 

Laadullista tekstianalyysia on mahdollista ja melko tavanomaistakin 
tukea määrällisen analyysin avulla eli laskemalla kielenpiirteiden esiin- 
tymämääriä ja vertailemalla niitä tekstinosittain tai suhteessa muun 
tyyppisiin teksteihin (esim. Kankaanpää 2006; Tiililä 2007). Itse asias- 
sa voi olla vaikea löytää tekstintutkimusta, jossa ei aineistoa kuvattaessa 
käytettäisi lainkaan suuntaa antavia kvantifioivia ilmauksia, kuten yleen- 
sä, usein, tavallisesti tai harvoin. Tällaiset luonnehdinnat jäävät kuiten- 
kin kvasikvantifioiviksi, ellei esiintymien määriä osoiteta kurinalaisesti 
kuvaamalla, mistä otoksesta ja millaisin laskelmin tällaisiin tulkintoi- 
hin on päästy. (Heikkinen, Lounela & Voutilainen 2012, 330.) Mikäli 
tekstijoukkojen määrällinen vertailu on tutkimuksen pääasiallinen me- 
netelmä, tutkimus on todennäköisesti lähempänä korpuslingvistiikkaa 
kuin tekstintutkimusta (ks. esim. Historiallinen korpuslingvistiikka; 
Määrällinen korpuslingvistiikka tk.). Tutkimussuuntausten väliset rajat 


ovat toki häilyviä, ja samassa tutkimuksessa voidaan hyödyntää useita 
menetelmiä. 


3.2. Tutkimuskysymyksen muotoilu 


Kuten tieteellisessä tutkimuksessa yleensä myös tekstintutkimuksessa 
prosessi lähtee liikkeelle ongelmanasettelusta: on päätettävä, mitä ha- 
lutaan tutkia. Syyllistymättä liikaan psykologisointiin voinemme sanoa, 
että tutkimusongelman muotoutuminen tutkijan päässä on seurausta 
ainakin kahdesta seikasta: aiemman tutkimuskirjallisuuden tuntemuk- 
sesta ja omista empiirisistä tai metateoreettisista havainnoista. Näiden 
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avulla tutkija perustelee ns. tutkimusaukon, jota hän lähtee omassa 
työssään täyttämään. Tutkija on voinut esimerkiksi havaita teksteistä 
ilmiöitä, jotka sotivat tutkimusalalla vallitsevaa ymmärrystä vastaan tai 
jotka eivät ole selitettävissä aiemman kirjallisuuden tarjoamin teoreetti- 
sin välinein taikka joita ei ylipäätään ole tutkittu. 

Tekstintutkimuksen peruskysymyksiä ovat esimerkiksi seuraavat: 


e Millaisissa tekstiympäristöissä tietynlaisia kielellisiä rakentei- 
ta tai sanoja käytetään? Mitä tehtäviä ne näissä ympäristöissä 
toteuttavat? 

e Miten tietynlaisissa tekstiympäristöissä ilmaistaan tietynlaisia 
merkityksiä? 

e Miten tekstit toiminnallisina kokonaisuuksina rakentuvat? 

e Kuinka teksteissä suuntaudutaan oletettuun lukijaan tai yleisöön? 

e Miten teksteissä rakennetaan yhteyksiä paitsi yksittäisiin toisiin 
teksteihin myös yhteiskuntaan ja kulttuuriin laajemmin? 

e Kuinka tietynlaiset tai tietynlajiset tekstit ovat muuttuneet tietyllä 
ajanjaksolla? 

e Kuinka tekstejä tuotetaan ja tulkitaan? 


” » 


Kuvauksen (”millaisia”, ”miten”) lisäksi pyritään yleensä myös havainto- 
jen selittämiseen (”miksi”, ”mistä johtuu”). 

Tutkimusongelman muotoilu vaikuttaa siihen, millaisia ilmiöitä ai- 
neistosta nousee esiin tutkimuksen tuloksina. Hiidenmaa (2000, 185) 
on havainnollistanut asiaa seuraavasti: ”Tutkimus lehtitekstin olemuk- 
sesta nyt ja sata vuotta sitten on erilainen tutkimus, jos kysytään, mi- 
ten lehtiteksti on muuttunut sadassa vuodessa. Jos taas kysytään, millä 
tavoin lehtiteksti on erottunut muista teksteistä eri aikoina, löydetään 
erilaisia piirteitä, vaikka aineisto olisi sama.” 

Haastavinta tekstianalyysissa lienee irtautua omista ennakko- 
oletuksista ja arkiymmärrykseen nojaavasta tekstintulkinnasta — tavoit- 
teena on tekstin analysoiminen mahdollisimman puhtaalta pöydältä. 
Esimerkiksi arvottavasta evaluoinnista kiinnostunut aloitteleva tutkija 
saattaa arkiymmärryksen pohjalta olettaa, että kirja-arvioiden kaltaisissa 
teksteissä evaluointia ilmaistaan ennen muuta ns. asenneadjektiivein 
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(esim. hyvä, huono). Jos sitten jo ennen aineistoon tutustumista rajaa 
evaluoinnin tarkastelun tällaisiin adjektiiveihin, voi tuloksena olla hy- 
vinkin vinoutunut kuvaus siitä, millaisesta toiminnosta tai toiminnasta 
evaluoinnissa on kyse. 


3.3. Tekstiaineiston laatu ja laajuus 


Tekstintutkijat tarkastelevat yleensä niin sanottuja tosielämän teks- 
tejä, joita voidaan koota tutkimuksen tarpeisiin aidoista esiintymis- 
ympäristöistä tai valmiista tekstipankeista (esim. FIN-CLARIN-konsor- 
tion Kielipankki‘). Tietyin reunaehdoin mahdollista on koota aineistoa 
myös koeasetelmissa. Esimerkiksi koehenkilöiden kirjoitusten avulla on 
tutkittu kulttuurisia kertomusrakenteita. Kuuluisa on kansainvälinen 
vertaileva tutkimus, jossa samaa filminpätkää päärynöiden keruusta näy- 
tettiin eri maissa ja pyydettiin koehenkilöitä kertomaan, mitä filmissä 
tapahtuu (Chafe 1980; Kalliokoski 1987). 

Aineiston koon ja koostumuksen vaatimukset riippuvat tutkimukselle 
asetetuista tavoitteista. Tekstintutkijan on ensinnäkin mietittävä, mikä 
aineiston rooli on tutkimuksen kokonaisuudessa. Aineisto voi olla tutki- 
muskohde sinänsä. Näin on silloin, kun tutkitaan rajallisesti esimerkiksi 
tietyn kirjailijan tai yksittäisen teoksen tyyliä (esim. Kalliokoski 2008; 
Heikkinen & Voutilainen 2009) tai kun etsitään näyttöä oikeudellisia toi- 
mia tai rikosten selvittämistä varten (ns. forensinen kielentutkimus, ks. 
Coulthard & Johnson 2007; Tiililä 2014). Monesti tutkimusorientaatio 
on kuitenkin tätä laajempi: aineiston katsotaan konstruktivismin henges- 
sä antavan tietoa yhteiskunnassa tai tietyssä yhteisössä vallalla (tai muu- 
toksessa) olevista ajattelu- ja toimintatavoista. Tällöin tutkimuskohteena 
ei siis ole pelkästään yksittäinen teksti vaan paljon laaja-alaisempi ilmiö, 
esimerkiksi haastattelupuheeseen perustuvien sitaattien muodostamisen 
käytänteet journalismissa (Haapanen 2017) tai oppikirjojen tiedonkäsitys 
(Karvonen 1995). Toki myös jo yksittäisen tekstin analyysi edellyttää sen 
kiinnittämistä johonkin perinteeseen ja kulttuuriseen kontekstiin. 

Tyypillisimmillään aineisto koostuu kokonaisista teksteistä tai tie- 
tyn periaatteen mukaan kerätyistä tekstijaksoista (esim. opinnäytteiden 
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diskussio- eli pohdintaosat; Vuorijarvi 2013). Joillekin kysymyksenaset- 
teluille voi olla tarpeellista ottaa tarkasteluun mukaan myös kuvia ja 
muita ei-kielellisiä elementtejä. Esimerkiksi jos tutkitaan kuvatekstejä, 
on tietenkin välttämätöntä huomioida kielellisen ja kuvallisen vaikutus 
toisiinsa tekstin tulkinnassa (Heikkilä 2006). Multisemioottisuus on 
huomioitava myös silloin, kun kirjoitettua kieltä on käytetty aineistossa 
vain yhtenä semioottisena keinona muiden joukossa, kuten monesti 
mainoksissa ja tuotepakkauksissa. 

Aineiston koosta on vaikea antaa yleispäteviä ohjeita. Mikäli tutki- 
muksen tavoitteena on lähteä liikkeelle tekstiaineistoista ja esittää ha- 
vaintojen pohjalta yleistyksiä, on todennäköistä, että aineistoksi tarvi- 
taan ainakin kymmeniä, joskus satojakin tekstejä. Jos vaikkapa halutaan 
muodostaa yleistys siitä, millaisista toiminnallisista vaiheista tai jaksois- 
ta työhakemusten perusrakenne koostuu, yhdestä tekstistä saatava evi- 
denssi ei luonnollisestikaan riitä; esimerkiksi Koskelan (2014) tutkimus- 
aineisto koostui 30 työhakemuksesta. Toisaalta jo yksittäinenkin, hyvin 
valittu tekstiesimerkki voi palvella sen osoittamista, että jokin tutkimus- 
alalle vakiintunut väite tai taustaoletus on liian kapea tai yksioikoinen. 
Pieni aineisto voi riittää myös silloin, kun otetaan ensi askelia ja kar- 
toitetaan aiemmin tutkimattomia ilmiöitä. Tällaisia ovat 2000-luvulla 
olleet esimerkiksi tekstien hybridisyyteen eli mm. genrejen yhdistelyyn 
liittyvät ilmiöt (ks. luku 4.5.). Tekstiaineiston koostamiseen liittyviä ky- 
symyksiä ovat käsitelleet yksityiskohtaisemmin Heikkinen, Lounela ja 
Voutilainen (2012) sekä Pietikäinen ja Mäntynen (2019, 232-239). 


Mitä tekstintutkija tutkii? 


Tekstintutkimuksen aineistot ovat yleensä aitoja, ilman koejärjestelyitä 
tuotettuja tekstejä. Kysymyksenasettelut voivat vaihdella pienestä suu- 
reen. Voidaan esimerkiksi kysyä, millaisia virkkeenalkuisia kytköksiä teks- 
tissä on ja miten ne rakentavat tekstin merkityksiä. Toisaalta voidaan 
kysyä, miten uusia tarkoitteita esitellään tekstissä tai miten teksti raken- 
taa ja heijastaa yhteisön käsityksiä tekstin aiheesta. Koska tekstit ovat 
yhteisön toiminnan välineitä, tekstien toimintojen ja toimintarakenteiden 
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kuvaaminen on yksi tekstintutkimuksen tehtävä. Niinpä voidaan kysyä, 
miten tekstin argumentaatio rakentuu, miten tekstillä ohjaillaan lukijaa 
ja miten teksti asettuu osaksi yhteisön tekstivarantoa. 


4. Tekstianalyysin ulottuvuuksia ja 
näkökulmia 


Ongelmanasettelun ja aineistonkeruun jälkeen tekstintutkija voi ryhtyä 
itse analyysiin. Tämä tarkoittaa aineiston kielellistä lähilukua. Analyysi 
voi edetä tyvestä latvaan (engl. bottom up) eli kielellisestä mikrotasosta 
kohti tekstin makrotason ilmiöitä, esimerkiksi genreä ja sen mahdollisia 
toimintavaiheita. Vaihtoehtoisesti voidaan edetä latvasta tyveen (engl. 
top down) eli kokonaisjäsentelystä ja kontekstuaalisista piirteistä kohti 
tekstin kielellisiä yksityiskohtia. Tutkimuskysymyksestä riippuu, kuin- 
ka hienojakoista analyysia on tarpeen tehdä. Tavoitteena ei ole sanoa 
teksteistä kaikkea vaan tunnistaa ne piirteet, jotka kulloinkin ovat olen- 
naiset selittämään aineiston ominaisuudet ja vastaamaan siitä tehtyyn 
tutkimuskysymykseen. 

Seuraavaksi esittelemme hieman yksityiskohtaisemmin tekstin- 
tutkimuksen analyysimenetelmiä erityyppisissä tutkimusasetelmissa. 
Tarkastelemme ensin koheesion sekä teeman- ja informaationkulun 
tutkimusta (luku 4.1.), sitten sanaston ja kieliopin käytön tutkimusta 
(4.2.). Tämän jälkeen käsittelemme diskurssikuvioiden tutkimusta (4.3.), 
genrejen tutkimusta (4.4.) ja lopuksi moniäänisyyden ja intertekstuaa- 
lisuuden tutkimusta (4.5.). 


4.1. Koheesio sekä teeman- ja informaationkulku 


Jo 1970-luvun tekstilingvistiikka oli kiinnostunut tekstinosien yh- 
teenkuuluvuudesta, tekstin etenemisestä ja tutun ja uuden tiedon 


844 MIKKOT. VIRTANEN JA PIRJO HIIDENMAA 


vuorottelusta. Niistä ensimmäisellä, koheesiolla, tarkoitetaan tekstin 
muodollista, kieliasusta ilmenevää sidosteisuutta ja yhtenäisyyttä virk- 
keiden välillä. Koheesiota voidaan tuottaa muun muassa konnektiivein, 
anaforisin ja kataforisin (eli tekstissä taakse- tai eteenpäin viittaavin) 
pro-sanoin sekä toiston avulla. Shorea (2012, 182) mukaillen voi todeta, 
että vaikka lukija ei ymmärtäisi tekstin sisältöä, tällaiset pääasiassa kieli- 
opilliset sidokset ohjaavat häntä tulkitsemaan sisällön suhteita tietyllä 
tavalla. Astetta implisiittisempiä koheesion keinoja ovat leksikaaliset 
keinot, esimerkiksi lähimerkityksisten sanojen käyttö (esim. yläkäsite- 
alakäsite, vastakohtaisuus). Ne ovat implisiittisempiä siksi, että sanojen 
merkityksiä ja merkityssuhteita koskeva tieto (esim. lekseemien jäädyke 
ja parfee välinen synonymia) ei ole oletettavasti kieliyhteisössä yhtä laa- 
jasti jaettua kuin kieliopin keinoja koskeva intuitiivinen tieto (ks. Kieli- 


taju kielentutkijan työkaluna tk.). Koheesion tutkimuksen klassikko on 
Hallidayn ja Hasanin (1976) teos Cohesion in English, jota Hakulinen 
ja Karlsson sovelsivat tuoreeltaan (1979) Nykysuomen lauseopissaan. 
Tekstintutkimuksessa koheesio on noussut keskeiseksi ilmiöksi esimer- 
kiksi oppikirjatekstejä tutkittaessa (Karvonen 1995). 

Koheesion lähikäsite on koherenssi, jolla tarkoitetaan tekstin funktio- 
naalista ja sisällöllistä järkeenkäypyyttä suhteessa sen sosiokulttuuri- 
seen kontekstiin. Koherenssin voi ymmärtää kattokäsitteeksi, jonka alle 
sisältyy ainakin tekstin genreen, toimintarakenteisiin, moniäänisyyteen 
ja intertekstuaaliseen liittyvät ilmiöt (ks. myös Rahtu 2006). Niitä tar- 
kastelemme luvuissa 4.3., 4.4. ja 4.5. 

Koheesion lisäksi tekstintutkimuksen perinteisiin kohteisiin lukeu- 
tuu tekstin teeman- ja informaationkulun tutkimus. Tällöin tutkitaan 
yhtäältä sitä, millaisin periaattein erityyppisissä teksteissä esitettyä tietoa 
jaetaan annettuun ja uutisarvoiseen, ja toisaalta sitä, millä tavoin teksti- 
yhteys vaikuttaa lauseiden jäsennykseen, esimerkiksi sanajärjestykseen 
tai valinnaisten määriteosien käyttöön (Thompson 2007; Shore 2008). 
Tällöin tekstiä tarkastellaan prosessina, joka toteutuu vähittäin, lause 
lauseelta, ja jossa jatkuvasti säädellään tekstiin konstruoitujen kirjoit- 
tajan ja lukijan jakaman yhteisen tiedon aluetta (ks. Virtanen, Rahtu & 
Shore 2018). Prosessi-näkökulmasta tekstin merkitys on siis liikkeessä 
koko ajan — edeltävässä tekstissä tuotetut merkitykset voivat tulevissa 
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tekstinosissa tarkentua, laajentua tai vaihtoehtoisesti kyseenalaistua taik- 
ka saada uudenlaisen tulkintakehyksen. 


4.2. Sanaston ja kieliopin käyttö tekstissä 


Lingvistisen tekstintutkimuksen peruskysymyksiin on kuulunut se, 
millaisissa tekstiympäristöissä tietynlaisia kielellisiä rakenteita tai sa- 
noja käytetään ja mitä tehtäviä ne näissä ympäristöissä toteuttavat. 
Vastakkaiselta suunnalta asetettu mutta yhtä lailla perustava kysymys 
on, millaisten kielellisten rakenteiden tai sanojen avulla tietynlaisissa 
tekstiympäristöissä ilmaistaan tietynlaisia merkityksiä. Edellisessä ta- 
pauksessa lähdetään siis liikkeelle yksittäisistä kielellisistä resursseista 
ja selvitetään niiden merkityspotentiaalia tekstimerkitysten rakentami- 
sessa. Tällaisesta lähtökohdasta on tutkittu esimerkiksi journalististen 
tekstien tietynmuotoisia passiivilauseita (esim. kysytäänpä asiantun- 
tijalta), jotka on tutkimuksen tuloksena nimetty dialogisiksi (Makko- 
nen-Craig 2005). Samantapaisesti on tutkittu muun muassa ylioppilas- 
aineiden että-lauseyhdistelmiä (esim. on totta, että; Juvonen 2010) sekä 
konditionaalin perfektissä olevia lauseita kirja-arvioissa (esim. tiivistämi- 
nen olisi parantanut teosta; Virtanen 2015).5 Lisäksi digitaalisten tekstien 
tutkimuksessa on tarkasteltu aihetunnisteiden (engl. hashtag) ja hyper- 
linkkien kaltaisia resursseja, joiden analyysissa on huomioitava myös 
viestintäteknologinen konteksti (ks. esim. Vitikka 2018; Salomaa 2019). 

Jos taas kysytään sitä, millaisia merkityksiä teksteissä on ja miten (ja 
missä määrin) ne syntyvät kielen keinoin, voidaan lähteä liikkeelle esi- 
merkiksi yhdestä toiminnosta ja tarkastella, millaisten kielellisten keino- 
jen avulla se voidaan toteuttaa ja millaiset kontekstuaaliset, esimerkiksi 
sekventiaaliset eli tekstin jaksotteluun liittyvät seikat keinon valintaan 
vaikuttavat. Tästä näkökulmasta on tarkasteltu esimerkiksi ohjailua hal- 
linnollisissa kirjeissä (Honkanen 2012) ja mielipidekirjoituksen teksti- 
lajiominaisuuksia sekä tekstilajin ontologiaa ja epistemologiaa yleensä 
(Nieminen 2010).° 

Kummassakin edellä esitellyssä lähestymistavassa on etunsa ja rajoit- 
teensa. Tiettyyn kielen keinoon keskittyminen voi tuottaa systemaattisen 
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analyysin keinon käyttötavoista konteksteineen mutta hataramman ku- 
van niistä toiminnoista ja toimintajaksoista, joiden toteuttamista keino 
palvelee. Jos taas asetetaan keskiöön tietty toiminto, voidaan saavuttaa 
syvällinen ymmärrys itse toiminnosta mutta ei välttämättä niistä kie- 
len keinoista, joiden avulla se toteutetaan. Näin ollen kokonaisvaltaisen 
ymmärryksen saavuttamiseen siitä, kuinka tekstimerkityksiä tuotetaan 
ja kuinka tekstuaalinen vuorovaikutus on mahdollista, tarvittaneen sopi- 
vassa suhteessa kumpaakin lähestymistapaa. (Vrt. Hakulinen & Selting 
2005, 9-10.) 


4.3. Diskurssikuvioiden tutkimus 


Tekstintutkimuksessa on alusta alkaen tutkittu ahkerasti tekstien ra- 
kenteita ja jäsentelykaavoja. Rakenne ymmärretään monien muiden 
kieliopintutkimuksen suuntausten mukaisesti merkityskuvioksi, jonka 
avulla kielenkäytössä tehdyt yksittäiset valinnat asettuvat osaksi laajem- 
paa, merkitystä kantavaa kokonaisuutta (ks. Shore 2012, 133—134). Siinä 
missä kieliopintutkimuksen ydintä on syntaktisten rakenteiden tutki- 
mus (ks. Kieliopin tutkimus ja kielioppiteoriat tk.), tekstintutkimuksen 
kiinnostus on diskursiivisissa rakenteissa eli diskurssikuvioissa, jotka 


jäsentävät tekstejä virkettä laajemmalla tasolla, esimerkkeinä rakenteet 
KYSYMYS-VASTAUS, YLEINEN-YKSITYISKOHTAINEN, MYÖNNYTYS-TOIMINTO, 
TOIMINTO-PERUSTELUJ Näistä kahdessa viimeisessä merkintä toiminto 
tarkoittaa, että rakenneosa voi toteutua lähes millaisena toimintona ta- 
hansa, esimerkiksi kysymyksenä, väitteenä tai ehdotuksena (Virtanen 
2015, 39-40). 

Mainitunlaisista rakenteista on suomalaisessa tekstintutkimuksessa 
kaytetty muun muassa nimityksià diskurssikuvio, retorinen kuvio tai ra- 
kenne, toimintasarja sekä toimintokuvio (kootusti ks. Virtanen 2015, 40). 
Tässä käytämme yleiskäsitteenä diskurssikuviota. Alan peruskysymys 
on, millä tavoin tekstit etenevät toiminnosta toiseen, mikä toimintojen 
keskinäinen työnjako on ja kuinka se käy teksteistä kielellisesti ja dis- 
kursiivisesti ilmi. Kuvioita on tutkittu teksteistä eri abstraktiotasoilta, 
virke- ja kappaletasolta aina lukujen tasolle asti. Lähtökohta onkin ollut, 
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että diskurssikuviot ovat skaalautuvia, niin että esimerkiksi kvsvwvs- 
VASTAUS-kuvio voi jäsentää yhtä hyvin kahden virkkeen kuin kahden kap- 
paleen välistä suhdetta (esim. Hoey 2001). 

Diskurssikuvioista on julkaistu tutkimuksia ainakin 1970-luvulta al- 
kaen. Suomalaisessakin tekstintutkimuksessa ahkerasti sovellettu malli 
on William Mannin ja Sandra Thompsonin (1988) kehittämä retorisen 
rakenteen teoria (engl. rhetorical structure theory, RST). Siinä rakenteita 
kutsutaan retorisiksi siksi, että niiden viimekätiseksi tarkoitusperäk- 
si nähdään lukijan ymmärrykseen ja suhtautumiseen vaikuttaminen. 
Esimerkiksi vÄITE-PERUSTELU-rakenne luo asetelman, jossa toinen 
tekstinosa näyttäytyy toisen valossa lukijalle uskottavampana, hyväksyt- 
tävämpänä tms. (Mann & Thompson 1988, 251). Teorian kovaa ydintä 
ovat Mannin ja Thompsonin (mt.) ehdottamat määritelmät noin 20 re- 
toriselle suhteelle. Vaikka tutkija voi halutessaan abstrahoida uusiakin 
suhdetyyppejä, perusjoukkoon nojaaminen mahdollistaa eri tekstilajeis- 
ta ja kielialueilta tehtyjen tutkimusten vertailun (Komppa 2012, 180). 
Vaihtoehtoisia mutta RST:n kanssa pitkälti yhteensopivia malleja ovat 
tarjonneet muun muassa Eugene Winter (1977; 1994), Michael Hoey 
(1983; 2001) ja James R. Martin (1992; Martin & Rose 2007 [2003]). 

Fennistiikassa diskurssikuvioita on tutkittu esimerkiksi journalisti- 
sista teksteistä (Makkonen-Craig 2005), yritysteksteistä (Visakko 2018), 
lukiolaisten kirjoitelmista (Juvonen 2010; Komppa 2012) ja tieteen teks- 
teistä (Virtanen 2015). Tyypillistä on ollut kiinnostus diskurssikuvioiden 
avulla rakennettuun vuorovaikutukseen kirjoittajan, lukijan ja mahdol- 
listen kolmansien (referoitujen) osapuolten välillä. Esimerkiksi yritysten 
visio-, missio- ja strategiatekstejä tutkinut Visakko (2018) on selvittänyt 
diskurssikuvioiden analyysilla yrityksen ja asiakkaan välille rakennetuis- 
sa sosiaalisissa suhteissa esiintyvää vaihtelua. Samanhenkisesti Juvonen 
(2010) on tarkastellut sitä, kuinka diskurssikuvioita käytetään ylioppilas- 
aineissa oman väitteen asemointiin ja erottamiseen tekstiin tuoduista 
muista väitteistä. 

Diskurssikuviot ovat kielellisen vuorovaikutuksen perusrakenteita: 
ne eivät ole genresidonnaisia eivätkä myöskään sidottuja kielenkäytön 
kanavaan — kirjoitetut tekstit ja puhutut keskustelut hyödyntävät sa- 
mantyyppisiä kuvioita, vaikka tutkimusalojen välinen terminologia 
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onkin erilaista. Esimerkiksi keskusteluntutkija tarkastelee Kysymys- 
VASTAUS-kuviota kahden osallistujan yhteisesti tuottamana vierusparina 
(esim. Raevaara 1997), kun taas tekstintutkija tarkastelee sitä kirjoitta- 
jan itsenäisesti tuottamana kuviona, jolla on tekstiä jäsentävä tehtävä 
(esim. Hoey 2001). Lisäksi monet kuvioista lienevät lähes universaale- 
ja, kulttuurista ja kielestä toiseen toistuvia (ks. esim. Enfield, Stivers & 
Levinson 2010). 


4.4. Genrejen tutkimus 


Diskurssikuvioiden eli tekstien yleisten toimintarakenteiden lisäksi 
tekstintutkimuksessa on tarkasteltu runsaasti myös yksittäisille teksti- 
lajeille eli genreille luonteenomaisia toimintajaksoja ja kokonais- 
jäsentelyitä. Tästä näkökulmasta on tutkittu esimerkiksi työhakemuksia 
(Koskela 2014), tiedotteita (Kankaanpää 2006; Honkanen 2012) sekä 
monia median genrejä (kootusti ks. Mäntynen 2006). Genren käsitteellä 
viitataan sosiaalisesti vakiintuneisiin toiminnan muotoihin, jotka nä- 
kyvät samaa tarkoitusta palvelevien tekstien ainakin jonkinasteisena 
samankaltaisuutena. Genren tuoma vakioisuus voi koskea tekstiraken- 
teen lisäksi tai asemasta monia muitakin asioita, esimerkiksi sisältöä, 
vuorovaikutussävyä, taittoa tai julkaisukontekstia. Monesti voidaan myös 
erottaa genreille ominaisia kieliopillisia ja sanastollisia ”avainpiirteitä” 
(Heikkinen 2009). Genret ovat olemassa yksittäisten tekstien kautta, ja 
niiden normit ja konventiot syntyvät, vakiintuvat ja muuttuvat tekstien 
virrassa.? (Ks. myös Diskurssianalyysi tk.) 

Genretutkimuksen perusoletuksiin kuuluu, että genret eivät toteudu 


kielenkäytössä puhtaina vaan kielelliset tuotokset asettuvat eri etäisyyk- 
sille genrejen prototyypeistä (esim. Shore & Mäntynen 2006; Martin 
& Rose 2008; Nieminen 2010). Genret ovat kehikkoja, joiden avulla 
tekstejä sekä tuotetaan että tulkitaan. Etenkin moniin institutionaalisiin 
teksteihin voi kyllä liittyä myös pakottavia genrenormeja, jolloin genreä 
edustavien tekstien välinen variaatio jää melko vähäiseksi. Esimerkiksi 
kokouksen esityslistan normit edellyttävät määrämuotoisuutta ja lisäk- 
si listan toimittamista kokouskutsun mukana. Päätösesityksessä taas 
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on ilmaistava tarkasti, onko kyseessä päätös, keskusteluasia vai tiedoksi 
merkittävä asia. Muilla elämänalueilla tavallisempaa lienee se, että gen- 
ren normit ovat enemmän tai vähemmän väljät ja joustavat. Siksi me- 
netelmällisesti mielekkäintä onkin, että genretutkija kuvaa ensin aineis- 
tonsa yksittäisiä tekstejä erikseen, jolloin tulokset kuvaavat yksittäisiä 
tekstejä, ja vasta sen jälkeen lähestyy genreä esittämällä siitä tekstiana- 
lyyseihin perustuvia yleistyksiä (Hiidenmaa 2000, 185). Bhatia (2004) 
ja Honkanen (2009) ovat korostaneet myös sen tärkeyttä, että genreana- 
lyysissa huomioitaisiin myös epätyypillisiä ja hankalia tapauksia. Tämä 
on tärkeää paitsi tutkimuseettisesti myös genreteorian kehittämisen 
kannalta. Hankalat tapaukset voivat nimittäin paljastaa kysymyksiä tai 
ulottuvuuksia, joiden suhteen teorian selitysvoima on vielä riittämätön. 

Toinen genretutkimuksen perusoletus on, että yhdellä tekstillä voi olla 
suhde moneen genreen, esimerkiksi niin, että tietty genre toteutetaan 
tekstissä toisen genren välityksellä. Esimerkiksi mielipidekirjoitus voi 
toteutua moralisoivan kertomuksen välityksellä ja musiikkiarvio ruoka- 
reseptin muodossa (ks. Mäntynen & Shore 2014). Jälkimmäisessä tapauk- 
sessa genren valinta on myös osa kannanottoa: reseptin muoto vihjaa, että 
musiikki on tehty kaavamaisesti. Kun teksti jäsentyy kahden tai useam- 
man genren risteyksessä, voidaan puhua myös hybridisyydestä — ilmiöstä, 
joka on 2000-luvulla enenevästi kiinnostanut tekstintutkijoita (ks. Visak- 
ko & Voutilainen 2012; Mäntynen & Shore 2014; Miller & Bayley 2016). 

Tunnettuja genretutkimuksen aloja ovat systeemis-funktionaali- 
seen perinteeseen nojaava Sydneyn koulukunta (esim. Martin & Rose 
2008), englannin ammattikielten tutkimus (English for Specific Purposes; 
Swales 1990; Bhatia 2004) sekä uusretorinen genretutkimus (esim. 
Miller 1984; Devitt 1991). Alojen välisiä eroja ja yhtäläisyyksiä ovat tar- 
kastelleet muiden muassa Solin (2009) sekä Heikkinen ja Voutilainen 
(2012). Yhtenä erona on se, missä määrin analyysi kohdistuu teksteihin 
(tuotoksiin), missä määrin tekstien tuottamiseen ja vastaanottoon sekä 
yhteisön jäsenten genrekäsityksiin. Esimerkiksi systeemis-funktionaa- 
linen perinne asettaa painon edelliseen, uusretorinen genretutkimus 
jälkimmäiseen. Erinomainen verkkosivusto genretutkijalle on Genre 
across borders". Sivusto tuo genretutkimuksen eri perinteitä yhteen ja 
sisältää muun muassa kattavan termipankin. 
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4.5. Moniäänisyys ja intertekstuaalisuus 


Tekstien moniäänisyyden tutkimus pyrkii selvittämään, millä keinoin 
erityyppisissä teksteissä tuodaan kirjoittajan äänen rinnalle muita ääniä 
tai näkökulmia ja asetetaan ne vuorovaikutukseen (ks. myös Diskurs- 
sianalyysi tk.). Äänen käsite on peräisin Bahtinilta (1981 [1934-1935]), ja 
se on sukua intertekstuaalisuuden eli tekstienvälisyyden käsitteelle, jonka 


Kristeva (1993 [1967]) esitteli Bahtinin ajatuksiin tukeutuen. Palaamme 
intertekstuaalisuuteen tuonnempana. 

Moniäänisyydellä tarkoitetaan vähintään kahden erilaisen äänen tai 
näkökulman samanaikaista läsnäoloa tekstissä. Konkreettisimmin tämä 
ilmenee tietenkin referointina, mutta kyse voi olla myös esimerkiksi 
ironiasta (Rahtu 2006) tai siitä, että tutkittavan tekstin sananvalinnat 
ja niiden kautta ilmaistut näkökulmat asettuvat vuorovaikutukseen jon- 
kin yhteiskunnallisesti tai kulttuurisesti tunnistettavan ajattelutavan tai 
käytänteen kanssa. Yksittäisessä tekstissä voi olla kyse vallitsevan ajat- 
telutavan tai käytänteen pönkittämisestä: tekstissä toistetaan (tietoisesti 
tai tiedostamatta) sitä, mikä on jo entuudestaan vakiintunutta, tai vä- 
hintäänkin selitetään, miksi vakiintuneesta poiketaan. Vaihtoehtoisesti 
teksteissä voidaan asettaa vallitsevia käytänteitä tai puhetapoja kriittisen 
keskustelun kohteeksi ja pyrkiä uudistamaan niitä. 

Vaikka bahtinilaisen ajattelun perusta on, että ollakseen ymmärret- 
tävää kielenkäytön on oltava riittävän moniäänistä — asetuttava riittävän 
selvästi osaksi aiempaa perinnettä —, tekstintutkimuksessa on siitä huo- 
limatta erotettu omaksi kielenkäytön moodikseen yksiäänisyys. Tällöin 
yksiäänisyydellä tarkoitetaan retorista vaikutelmaa siitä, että tekstissä ei 
anneta huomiota vastakkaisille tai vaihtoehtoisille näkökulmille (Martin 
& White 2005, luku 3). Usein kyse on myös siitä, että tekstistä ei käy 
ilmi, mistä tai keneltä ajatus tai merkitys on peräisin. 

Tekstien äänisyyttä on tarkasteltu 2000-luvulla runsaasti systeemis- 
funktionaalisen suhtautumisen teorian (engl. appraisal theory) avulla (ks. 
Martin & White 2005). Teoria lähestyy tekstejä kirjoittajan hallitsemina 
dialogisina tiloina (engl. dialogic space). Virtanen (2015, 30) on tulkinnut, 
että dialogisella tilalla tarkoitetaan tekstiin konstruoitua vuorovaikutus- 
aluetta, jolla kirjoittaja luo suhteita tekstissä läsnäolevaksi tehtyihin 
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muihin osapuoliin (ks. Diskurssianalyysi tk.). Vuorovaikutusalue on dy- 


naaminen: sitä säädellään ja muokataan tekstin toiminnosta ja vaiheesta 
toiseen edetessä. Dialogisen tilan käsitteen avulla voidaan tarkastella 
esimerkiksi sitä, kuinka paljon oletetulle lukijalle annetaan liikkuma- 
varaa responsiivisena toimijana. Kun dialoginen tila rakennetaan ka- 
peaksi (esimerkiksi kategorisia väitteitä tai käskyjä esittämällä), lukijalta 
odotetaan samanmielistä tai ainakin myöntyväistä responssia. Kun taas 
tila konstruoidaan väljäksi (esimerkiksi esittämällä väite varauksellisesti 
tai käsky pyyntönä), tekstissä osoitetaan eriasteisesti suvaitsevaisuutta 
myös erimielistä, epäilevää tai vastahankaista lukijaa kohtaan. (Martin 
& White 2005, luku 3.) 

Kuten aiemmin totesimme, tekstien moniäänisyyden tutkiminen 
tulee lähelle intertekstuaalisuuden tutkimista: molemmissa etsitään 
merkkejä tai vihjeitä siitä, että teksti on yhteydessä toiseen tekstiin tai 
yleisemmin esimerkiksi genreen tai diskurssiin. Yhtenä käytännöllisenä 
erona on kuitenkin se, että moniäänisyyden käsitteeseen sisältyvä äänen 
käsite mahdollistaa intertekstuaalisuuden käsitettä paremmin myös teki- 
jän äänen huomioinnin ja sen tarkastelemisen, kuinka tekijän ääni on 
asemoitu suhteessa tekstiin tuotuihin muihin ääniin (Virtanen 2015, 43). 

Yhtä kaikki myös intertekstuaalisuuden käsitettä on hyödynnetty 
tekstintutkimuksessa runsaasti. Tutkimusperinteestä voidaan erottaa 
ainakin kaksi erilaista suuntausta: yhtäältä tekstistä syntyvien inter- 
tekstuaalisten vaikutelmien tutkiminen, toisaalta samaan genreketjuun 
kuuluvien tekstien vertailu. Siinä missä kieliopintutkijaa kiinnostaa 
tekstienvälisyyden analyysissa se, millaisin kieliopillisesti kiteytynein 
keinoin tekstienvälistä suhdetta voidaan ilmaista ja kuinka eri keinot 
suhteutuvat toisiinsa kielijärjestelmässä (esim. Kuiri 1984; Shore 2005), 
tekstintutkijaa kiinnostaa ensisijaisesti se, millaisia vakiintuneita käyttö- 
tapoja intertekstuaalisuuden ilmenemismuodoilla on eri tekstilajeissa. 
Voidaan selvittää esimerkiksi sitä, miksi henkilökohtaisissa blogikirjoi- 
tuksissa referoidaan vuoropuheluja (Virtanen & Juvonen 2018), miksi 
yleistajuiset kielijutut aloitetaan usein referoinnilla (Mäntynen 2005) tai 
millä tavoin naispareja referoidaan lehtiartikkeleissa (Uotinen 2007). 
Tällöin tutkitaan siis intertekstuaalisuuteen liittyviä genrekäytänteitä ja 
pyritään kirjoittamaan niitä auki. 
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Metodistisestikin omanlaisekseen tekstienvälisyyden tutkimukseksi 
hahmottuu tekstilajiketjujen ja rekontekstualisoinnin tutkimus. Tällöin 
kiinnostuksen kohteena on se, millaisia vakiintuneita, ennakoitavia 
yhteyksiä kahteen tai useampaan tekstilajiin kuuluvien tekstien välillä 
on olemassa. Peruskysymyksiä ovat, millä tavoin merkityksiä välitetään 
tekstilajista toiseen, miten merkitykset muuttuvat tämän prosessin ai- 
kana ja mistä syystä. Metodisesti tällainen tutkimus edellyttää kahden 
tai useamman osa-aineiston keräämistä. Analyysivaiheessa näitä osa- 
aineistoja sitten vertaillaan toisiinsa ja osoitetaan, miten merkitykset 
muuttuvat niiden siirtyessä tekstilajista toiseen. Muutosten syiden sel- 
vittäminen saattaa edellyttää tekstianalyysin lisäksi tekstilajien käyttäjien 
haastattelemista tai heidän toimintansa havainnointia. Tekstilajiketju- 
ja on tutkittu esimerkiksi sen kannalta, miten asiantuntijaraporteista 
laaditaan lehdistötiedotteita ja edelleen uutisjuttuja päivälehtiin; tutki- 
muksen perusteella merkityksenmuutokset ovat yleisiä etenkin lehdistö- 
tiedotteista tehdyissä uutisjutuissa, joissa esimerkiksi suoraviivaistetaan 
tiedotteissa kerrottuja kausaalisuhteita ja kärjistetään määrää koskevia 
väitteitä (ks. Solin 2001). 

Rekontekstualisoinnin tutkimuksessa on puolestaan tarkasteltu 
esimerkiksi sitä, millaisin käytäntein toimituksellisista haastatteluista 
muokataan sitaatteja lehtijuttuun (Haapanen 2017). Haapasen mukaan 
käytänteet ovat moninaiset — sitaatin ja haastattelun välinen suhde ei 
useinkaan ole yksioikoinen. Esimerkiksi monologisoinniksi nimetys- 
sä muokkauskäytänteessä toimittajan ja haastateltavan välinen vuoro- 
puhelu pelkistetään lehtijutussa yhdeksi, haastateltavan tuottamaksi pu- 
heenvuoroksi. Tällöin haastateltavan äänellä saatetaan siis esittää myös 
sellaista, mitä hän ei tosiasiallisesti ole sanonut. (Mt.) 


Tekstianalyysin lähestymistapoja 


Tekstianalyysissa yhdistyy interaktionistinen ja konstruktivistinen tutki- 
musote: tekstejä tarkastellaan sekä paikallisena, tilannesidonnaisena 
vuorovaikutuksena että yhteisöllisenä ja kulttuurisena toimintana. 
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Tekstejä voidaan tutkia sekä tuotoksina (mm. kokonaisjäsentely) että 
prosesseina (mm. teeman- ja informaationkulku). Näkökulmat täyden- 
tävät toisiaan. 


Kielen ja tekstin suhdetta voidaan tarkastella lähtemällä liikkeelle tie- 
tystä kielen keinosta ja tutkimalla sen käyttötapoja ja -yhteyksiä teksti- 
joukossa. Vaihtoehtoisesti voidaan ottaa lähtökohdaksi tietty toiminto tai 
merkityspiirre ja selvittää, kuinka se reaalistuu eli todentuu kielellisesti. 


5. Yhteenveto 


Nykyinen digitaalinen ja visuaalisia keinoja hyödyntävä tekstimaailma — 
niin sanottu uusi kirjoittaminen (engl. new writing; van Leeuwen 2008) 
— versoo moneen suuntaan, mikä vaatii tekstintutkimuksen menetel- 
mien ja teorioiden jatkuvaa kehittämistä. Nykytekstit yhdistelevät yhä 
monipuolisemmin erilaisia semioottisia järjestelmiä ja moodeja toi- 
siinsa ja hyödyntävät luovasti teknologisten alustojensa käyttömahdolli- 
suuksia. Niiden koherenssi ei ehkä rakennu samalla tavoin kuin suun- 
niteltujen monologimuotoon laadittujen tekstien. On myös olemassa 
digitaalisia kirjoitetun kielenkäytön muotoja, jotka asettuvat monologin 
ja vuoropuhelun välimaastoon. Esimerkiksi keskustelu- ja kommentti- 
palstojen vuorovaikutuksessa puheenvuorot ovat monesti rakenteelli- 
sesti ja toiminnallisesti mutkikkaampia kokonaisuuksia kuin pikavies- 
tittelyn puheenvuorot, ja niissä käytetään monia perinteisille teksteille 
ominaisia jäsentelykeinoja, kuten otsikointia ja kappalejakoa. Tällaisten 
keskusteluiden tutkiminen teksti- ja keskustelunanalyysia yhdistelmällä 
voi olla perusteltu ratkaisu (ks. Virtanen & Kääntä 2018; Lahti 2019). 
Sen lisäksi, että tekstintutkimus tuottaa tietoa teksteistä ja niiden 
moniulotteisista merkityksistä, samalla syntyy tietoa myös kielen osa- 
järjestelmistä ja kieliopista. Esimerkiksi lauseyhdistelmien tutkiminen 
eri tekstilajeista on koetellut kieliopintutkimuksen näkemyksiä alistei- 
suudesta (ks. esim. Shore 2005; Juvonen 2010; Virtanen 2015, luku 4). 
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Monissa tutkimuksissa on kuvattu myös kulttuurisia kirjoittamisen käy- 
tänteitä ja yhteisöjen toimintaa yksittäisiä tekstejä tai genrejä laajem- 
masta näkökulmasta. Esimerkiksi oppikirjatekstien tutkimuksen avulla 
voidaan esittää huomioita pedagogisen tiedon luonteesta (esim. Karvo- 
nen 1995), samoin tutkimusartikkelien analyysi antaa kuvaa kulttuuri- 
eroista (esim. Mauranen 1993). Viranomaistekstejä tutkimalla voidaan 
kuvata hallinnon ideologiaa (esim. Sarangi & Slembrouck 1996; Tiililä 
2007; Honkanen 2012). 

Metateoreettisemmin suuntautunut tekstintutkimus on suunnan- 
nut kriittisen katseensa tutkimusalan ontologisiin, epistemologisiin ja 
metodologisiin perusoletuksiin (ks. Phakiti & Paltridge 2015, 17-20). 
Tästä hyviä esimerkkejä ovat pohdinnat siitä, mitä tekstit (ks. Visakko 
2015) ja genret (ks. Nieminen 2010) ylipäätään ovat ja miten eri aika- 
kausien aineistoja asetetaan samalle viivalle ottaen huomioon tekstien 
sosiokulttuuriset kontekstit (ks. Nord 2008; vrt. Näkökulmia filolo- 


giseen tutkimukseen tk.). Tekstintutkimus tarjoaa menetelmiä myös 
yhteiskunnan ja käyttäytymisen tutkijoille, joiden mielenkiinto koskee 


yhteiskunnan, vallan, demokratian, instituutioiden ja identiteettien tut- 
kimusta eikä ensisijaisesti kielen ja kielenkäytön olemusta (ks. esim. 
Ruohonen, Sevänen & Turunen 2011; vrt. Diskurssianalyysi tk.). Näin 
tekstintutkimus elää omaa rikasta elämäänsä myös kielentutkimuksen 


ulkopuolella, mikä tarkoittaa jatkuvaa tutkimusalojen risteämistä. 
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Vuoropuheluna toteutuvien puhuttujen tekstien tutkimuksesta ks. Keskustelunanalyysi 
ja vuorovaikutuslingvistiikka tk.; vrt. Eggins & Slade (2006 [1996]). Kirjoitetun vuoro- 


puhelun tutkimuksen menetelmistä ks. esim. Virtanen & Kääntä (2018). Internetin ei-li- 
neaaristen hypertekstien tutkimuksesta ks. Koskimaa (2012). 

Artikkelissamme esiteltyä tekstintutkimusta täydentää esimerkiksi tekstien kognitiivista 
prosessointia käsittelevä tutkimus, jossa tukeudutaan usein kokeellisiin asetelmiin 
(esim. Sanders, Schilperood & Spooren 2001; Kaakinen & Hyönä 2012). 

Diskurssilla eli puhetavalla tarkoitetaan kiteytynyttä ja kulttuuris-yhteisöllisesti tunnistet- 
tavaa merkityksellistamisen tapaa, joka voi ilmetä esimerkiksi tieteellisille teksteille omi- 
naisena näkökulmaisuutena (esim. Pietikäinen & Mäntynen 2019, 33; ks. myös Foucault 


2005 [1969] ja Diskurssianalyysi tk.). 
https://www.kielipankki.fi. 


Tekstin pintatasosta voi tarkkailla jopa fonologisia ominaisuuksia, mikäli ne tuntuvat 
aineiston kannalta relevanteilta. Esimerkiksi runoudelle tyypillinen alkusointu on monen 
mainoksen tehokeino ("piristà päivääsi puristeilla"). 


Epistemologian ja ontologian käsitteistä ks. Johdannon luku 2 tk. 

Diskurssikuviot on alan kirjallisuudessa tapana kirjoittaa kapiteelein. 

Lisäksi systeemis-funktionaalisessa perinteessä käytetään nimitystä kytkentä (engl. 
conjunction). Ks. Martin & Rose (2007); suomeksi Shore (2012). 

Tekstilajin muutoksen tutkimuksesta ks. Kankaanpää (2012). 


10 http://www.genreacrossborders.org. 
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Mikä? 


Sosiolingvistiikassa tutkitaan kielen ja yhteiskunnan suhdetta. Keskeisiä 
tutkimuskohteita ovat kielen variaatio ja muutos, variaation ja vuoro- 
vaikutuksen suhde, monikielisyys, kielenvaihto ja kielen säilyttäminen 
sekä kieliasenteet. Tutkimuksessa sovelletaan sekä kvantitatiivisia että 
kvalitatiivisia menetelmiä ja aineistot voivat olla monentyyppisiä. 


Katso myös: 

Luku 2 Kysely 

Luku 3 Haastattelu aineistonkeruun metodina sosiolingvistiikassa 
Luku 5 Lingvistinen etnografia toimintayhteisöissä 
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864 PIRKKO NUOLIJÄRVI JA HANNA LAPPALAINEN 


1. Johdanto: mitä on sosiolingvistiikka? 


Sosiolingvistiikka on kielentutkimuksen alue, joka tarkastelee kielen- 
käytön ja yhteiskunnan sosiaalisen rakentumisen suhdetta. Tutkimus- 
kohteina ovat kieliyhteisön variaatio, kielen muuttuminen, kielen 
funktiot vuorovaikutuksessa, kieliä koskevat asenteet ja käsitykset 
sekä monikielisyys. Historiallinen sosiolingvistiikka tarkastelee kielen- 
muutosta pitemmällä aikavälillä ja kirjallisten lähteiden avulla (ks. esim. 
Nevalainen & Raumolin-Brunberg 2003), kun taas nykykieleen keskit- 
tyvä sosiolingvistinen tutkimus lähestyy muutosta ennen muuta synk- 
ronisesti tai ainakin lyhyemmällä aikajänteellä puhutun ja kirjoitetun 
kielen aineistojen valossa. Diakronisen ja synkronisen näkökulman raja 
ei kuitenkaan ole jyrkkä, koska kielenkäytön tutkiminen ja muutosten 
tarkastelu tiettynä ajankohtana tarvitsee taustakseen tietoa aiempien vai- 
heiden kielenkäytöstä (ks. esim. Milroy, J. & Milroy, L. 1997). 
Sosiolingvistiikka on siten vahvasti aineistolähtöinen tutkimussuun- 
ta, joka määrällisin ja laadullisin menetelmin analysoi kielellisen va- 
riaation esiintymisehtoja, variaation funktioita sekä niiden muutosta 
yhteiskunnallisessa kontekstissa. Analyysissa on olennaista osoittaa, 
mihin aineistosta tehdyt tulkinnat perustuvat. Sosiolingvistiikka on siis 
empiiriseen näyttöön perustuvaa tutkimusta, jossa aineiston rajallisuus 
tai käsittelytavan kriittiset pisteet tuodaan lukijan näkyville. (Haastattelu- 
aineiston keruun, käsittelyn ja julkaisemisen etiikasta ks. Haastattelu 
aineistonkeruun metodina sosiolingvistiikassa tässä kirjassa.) 


Sosiolingvistiikkaa ja kielisosiologiaa on usein pidetty synonyymeina, 
mutta niitä edustavat suuntaukset painottuvat eri tavoin. Teoksessaan 
Sociolinguistic Theory (2009) J. K. Chambers määrittelee sosiolingvis- 
tiikan ja kielisosiologian limittyvien kenttien eron niin, että kummas- 
sakin suuntauksessa tutkitaan kielen ja yhteiskunnan suhdetta, mutta 
sosiolingvistiikan tavoitteena on ymmärtää kielen rakennetta ja kieli- 
sosiologian tavoitteena yhteiskunnan rakennetta. Sosiolingvistiikan 
myöhempi historia on osoittanut, että tämä ero ei ole selvärajainen; yk- 
silöiden ja ryhmien kielen vaihtelua tutkiessaan sosiolingvisti on mitä 
suurimmassa määrin yhteiskunnan rakenteen ytimessä. Chambersin 
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kuvaus sosiolingvistiikan alasta on kaikkineenkin suppea. Laajimmin 
sosiolingvistiikan alaa lienee kuvannut M. A. K. Halliday, joka jo vuon- 
na 1972 esitti, että sosiolingvistiikkaan voi lukea seuraavat alueet (ks. 
Gardin & Marcellesi 1987): kielen makrososiologia ja kielellinen de- 
mografia; diglossia, monikielisyys ja useamman kielimuodon hallinta; 
kielen suunnittelu, kehitys ja standardointi; pidginisaatio ja kreolisaa- 
tio; sosiaalisten murteiden ja ei-standardien varieteettien kuvaus; sosio- 
lingvistiikka ja koulutus; puheen etnografia; rekisterit ja repertuaarit 
sekä koodinvaihto; kieliopillisten ja fonologisten muutosten sosiaaliset 
taustatekijät; kieli, sosiaalistuminen ja kulttuurinen muutos; sosioling- 
vistinen näkökulma lasten kielelliseen kehitykseen; kielellisen systee- 
min funktionaaliset teoriat; lingvistinen relativismi; etnometodologinen 
lingvistiikka ja tekstiteoria. Nykynäkökulmasta sosiolingvistinen lähes- 
tymistapa koskettaa monia näistä aloista, vaikkei kaikkia yhtä vahvasti. 
Tässä artikkelissa keskitymme erityisesti niihin alueisiin, jotka ovat 
lähes 50 vuoden aikana olleet suomalaisessa tutkimuksessa keskeisiä. 
Vaikka monet sosiolingvistit niin Suomessa kuin muuallakin ovat ol- 
leet aktiivisia myös kielipolitiikan ja kielikoulutuspolitiikan alueella ja 
osallistuneet siihen liittyvään lainsäädäntötyöhön ja kielten asemaa kos- 
kevaan keskusteluun, usein yhdessä muiden alojen lingvistien kanssa 
(ks. esim. Latomaa & Nuolijärvi 2005; Gregersen 2014; Sarhimaa 2017), 
rajaamme tässä yhteydessä tämän kentän tarkastelumme ulkopuolelle. 


2. Suomalaisen sosiolingvistiikan 
kansainvälistä taustaa ja historiaa 


Ensimmäisen kerran sosiolingvistiikka-termi on tiettävästi mainittu vuon- 
na 1952, jolloin Haver C. Currie julkaisi artikkelin ”Projections of socio- 
linguistics” (ks. Coulmas 1997). Sosiaaliset erot huomioon ottava tutki- 
mus alkoi 1950-luvulla tulla osaksi kielentutkimusta, mutta käsitteenä 
ja tutkimussuuntana sosiolingvistiikka vakiintui vasta 1960-luvulla 
William Labovin (1966) työn ansiosta. Labovilainen tutkimustraditio 
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edustaa variationistista sosiolingvistiikkaa. Muita keskeisiä tutkimus- 
perinteitä ovat antropologinen traditio (ks. Hymes 1971), vuorovaikutus- 
sosiolingvistiikka (ks. Gumperz 1982), kielisosiologia (ks. Fishman 
1968) ja kieliasennetutkimus eri muodoissaan (ks. esim. Giles & St 
Clair 1979; Preston 1989; 1999; Long & Preston 2000). 

Sosiolingvistiikan keskeisiä käsitteitä ovat vaihtelu ja muutos, ja sen 
piirissä näitä tarkastellaan yhteiskunnallisten ja sosiaalisten muutos- 
ten kehyksissä. Nikolas Coupland (2009) suhteuttaa sosiolingvistisen 
tutkimuksen taustan ja myöhemmät vaiheet yhteiskunnalliseen ke- 
hitykseen seuraavalla tavalla: Dialektologista tutkimusta harjoitettiin 
esimodernistisessa vaiheessa. Tällöin perinteinen dialektologia oli lä- 
heisesti sidoksissa historialliseen kielentutkimukseen ja kielellisten 
muotojen arveltiin todistavan vanhemmista kulttuurikäytänteistä. So- 
siaaliset prosessit sinällään eivät kuitenkaan olleet murteentutkijoiden 
kiinnostuksen kohteina. Variationistinen sosiolingvistiikka puolestaan 
perustui modernismin käsityksiin yhteiskunnasta; kielenkäytön tausta- 
muuttujina tarkasteltiin sukupuolta, luokkaa ja ikää. Ne vakiintuivat 
osaksi variaationtutkimusta, ja ne nähtiin ikään kuin annettuina (tausta- 
muuttujia koskevasta kritiikistä ks. esim. Nuolijärvi 2000). Variatio- 
nistinen sosiolingvistiikkakaan ei juuri tarkastellut sitä, miten kielen 
variaatio ja käyttö ovat sidoksissa muuttuvaan sosiokulttuuriseen eko- 
systeemiin. Nykyistä niin sanottua dekonstruktiivista sosiolingvistiikkaa 
harjoitetaan myöhäismodernismin ja globalisaation ympäristössä; mur- 
teen ja standardin käsitteitä tarkastellaan kriittisemmin kuin aiemmin 
ja selvärajaisten varieteettien olemassaolo kyseenalaistetaan (Johnstone 
2011; Vaattovaara 2016, 85—92). Couplandin mukaan tähän mennessä 
sosiolingvistiikassa on kuitenkin kaikkina aikoina tarkasteltu kielen ja 
sosiaalisen muutoksen suhdetta varsin rajallisesti. 

Sosiolingvistinen tutkimus on silti implisiittisesti aina lähtenyt siitä, 
että yhteiskunnan muutokset, kuten elinkeinorakenteen ja koulutuk- 
sen muutokset, näkyvät kielessä. Ne vaikuttavat kielenkäyttötapoihin ja 
vuorovaikutuksen kehyksiin, mutta tätä prosessia ei pidä olettaa yksi- 
suuntaiseksi eikä mekaaniseksi. Kielenkäyttö puolestaan vaikuttaa sii- 
hen, millainen yhteiskunta on ja millaisena sen toiminta näyttäytyy, eikä 
näitä kahta voi pitää toisistaan erillisinä ilmiöinä. 
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Vaihtelu kuuluu kielen olemukseen, ja sen pohjalta kieli voi pitkällä 
aikavälillä muuttua, mutta kaikki variaatio ei johda muutokseen. Siten 
sosiolingvistiikka on kiinnostunut myös siitä, millainen vaihtelu on py- 
syvää, millaiset muodot elävät rinnakkain kielenkäyttäjien repertuaarissa 
eli yksilön tai ryhmän käyttämien kielimuotojen muodostamassa koko- 
naisuudessa ja mikä kunkin muodon tehtävä on vuorovaikutuksessa. 
Sosiolingvistiikka pyrkii selvittämään myös sitä, miksi jokin variantti jää 
pois käytöstä. Analyysissa kiinnitetään huomio sekä kielensisäisiin että 
-ulkoisiin tekijöihin. Kaikkiaan voi yhtyä Couplandin edellä kuvattuihin 
käsityksiin siitä, että sosiolingvistit ovat tulkinneet yhteiskunnan ja kie- 
len suhdetta varsin varovaisesti, vaikka eri tutkijat ovat myös Suomessa 
painottaneet tätä suhdetta eri tavoin. 

Suomalaisen sosiolingvistiikan alkuvaiheet nousevat sekä dialekto- 
logian tutkimuksesta että labovilaisen variaationtutkimuksen perinteestä 
(ks. esim. Siitonen 1981; Mielikäinen 1982; Juusela 1994). Dialektologit 
tutkivat alueellista vaihtelua analysoimalla lähinnä maaseudun murtei- 
den äänne- ja muotopiirteitä. Kohteena oli samalla maaseutupaikka- 
kunnalla asuneiden vanhusten kielimuoto. Labovin jalanjäljissä 
brittiläiset ja pohjoismaiset sosiolingvistit kohdistivat huomionsa kau- 
punkipuhekielten ja maaseudun murteiden fonetiikkaan, fonologiaan 
ja morfologiaan. Tutkimusten kohteena oli eri-ikäisten ja eritaustaisten 
puhujien kielimuoto. Ennen varsinaisen sosiolingvistisen tutkimuk- 
sen käynnistämistä Suomessa julkaistiin murteentutkimuksen piirissä 
muutamia tutkimuksia siitä, miten muutto vaikuttaa murteen muut- 
tumiseen. Niissä analysoitiin eri paikkakunnille sodan jälkeen asutet- 
tujen eri-ikäisten siirtokarjalaisten puhekieltä (ks. Jahnukainen 1954; 
Leskinen 1974; 1980). Jahnukaisen pro gradu -tutkielmaa ja Leskisen 
varhaisempaa tutkimusta voi pitää eräänlaisina suomalaisen sosioling- 
vistisen tutkimuksen etiäisinä esimerkiksi siksi, että niissä tarkastellaan 
useamman sukupolven ja sukupuolten välisiä eroja, mikä sittemmin on 
ollut tavallista sosiolingvistisissä variaationtutkimuksissa. 

Sosiolingvisti Penelope Eckert (2012) on hahmotellut kolme sosio- 
lingvistiikan aaltoa, jotka ovat tunnistettavissa myös suomen kielen 
sosiolingvistisessä tutkimuksessa. Aallot ovat kuitenkin vain suuntaa 
antavia jäsennyksiä, eivätkä eri aaltojen rajat siten ole selviä; toisistaan 
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erottuvien aaltojen sijasta voi mieluummin nähdä aallokon (ks. esim. 
Eckert & Labov 2017). Numerointi synnyttää helposti ajatuksen aaltojen 
erilaisesta arvottamisesta, mutta oma lähtökohtamme on, että nume- 
rointi kuvaa aaltojen ajallista järjestystä eli osittain tutkimushistoriallis- 
ta kronologiaa. Jokaisella vaiheella on oma olennainen paikkansa, eikä 
uuden vaiheen alku tarkoita edellisen loppumista. Kysymys on enem- 
mänkin tutkimuksen painopisteiden muutoksesta tai uusien tutkimus- 
tapojen tulosta entisten rinnalle. 

Ensimmäisessä aallossa vallitsevana suuntauksena oli kvantitatiivi- 
seen analyysiin painottunut labovilainen sosiolingvistiikka, jonka mu- 
kaan ihminen omaksuu puhetapansa ympäristön vaikutuksesta (Labov 
1966). Labovin lisäksi suomalaiseen tutkimukseen vaikutti vahvasti brit- 
tiläinen variaationtutkimus (Trudgill 1974) sekä pohjoismainen tutki- 
mus ja sittemmin yhteistyö pohjoismaisten tutkijoiden kanssa (ks. esim. 
Thelander 19793; 1979b; Nordberg 1994). Suomessa vallalla oli 1970-lu- 
vulta 1990-luvulle asti juuri labovilainen sosiolingvistiikka. Labovilaisen 
variaationtutkimuksen menetelmiä käytettiin Suomessa ensimmäisen 
kerran Nykysuomalaisen puhekielen murroksen tutkimuksessa (1976), 
jonka vastuullisena johtajana toimi Heikki Paunonen. Variaatiota suh- 
teutettiin kielenulkoisiin muuttujiin, joista yleisimmin tarkasteltiin ikää, 
sukupuolta ja sosiaaliryhmää sekä asuinympäristöä. Painettujen julkai- 
sujen lisäksi (ks. esim. Mielikäinen 1980; 1981b; 1981c; 1986; Jonninen- 
Niilekselä 1982; Suojanen, M. K. 1981; 1985; Nuolijärvi 1986b) runsaasti 
tutkimustietoa on kymmenissä pro gradu -tutkielmissa, joissa on pää- 
osin tarkasteltu äänne- ja muotovariaatiota. Erityisen kiinnostuksen 
kohteena oli ikämuuttuja ja nuorten kieli, koska yhtenä keskeisenä ole- 
tuksena oli, että nuorten valinnat kuvastavat kielen muutoksen trendejä 
(ks. Lappalainen 2001). Samaan aikaan oli kuitenkin merkkejä myös 
toisenlaisista lähestymistavoista, kuten Turun puhekielen projektissa, 
jossa aineistona oli myös kokouskeskusteluja ja tutkimuksen kohteena 
syntaksin ilmiöitä (ks. mm. Suojanen, M. K. & Suojanen, P. 1982; Suo- 
janen, M. K. 1985). Myös perinteinen kansanlingvistiikka voidaan lukea 
ensimmäisen aallon tutkimuksiin; se on tarkastellut kielellisiä asenteita 
ja käsityksiä kielimuodoista (ks. esim. Mielikäinen & Palander 2014; 
Vaattovaara 2009; Nupponen 2011). 
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Toisen aallon sosiolingvistiikassa korostuvat sosiaaliset verkostot, 
ryhmäkytkökset sekä sosiaalinen orientaatio ja kielellinen identiteetti 
(esim. Milroy 1980; Eckert 2000). Yksilöillä on erilaisia tyylillisiä käy- 
tänteitä, ja sosiaaliryhmällä ja sukupuolella on merkittävä rooli. Suo- 
messa variaationanalyysiin on yhdistetty etnometodologisesti suuntautu- 
nutta vuorovaikutuksen tutkimusta (esim. Lappalainen 2004; ks. myös 
Keskustelunanalyysi ja vuorovaikutuslingvistiikka tk.). 


Kolmannelle aallolle on tyypillistä, että variaatiota tarkastellaan indek- 
sisenä järjestelmänä; kiinnostuksen kohteena ovat indeksiset kentät ja 
se, miten merkitys syntyy vuorovaikutustilanteessa. Taustalla on Michael 
Silversteinin (2003) indeksisen järjestyksen (engl. indexical order) poh- 
jalta kehitetty ajatus sosiaalisesta indeksisyydestä, jolla tarkoitetaan sitä, 
että esimerkiksi jokin kielenpiirre synnyttää mielleyhtymän johonkin 
osallistujien tunnistamaan sosiaaliseen ryhmään niin, että tuosta as- 
sosiaatiosta tulee osa kyseisen kielenpiirteen tulkintaa (ks. esim. Leh- 
tonen 2015, 35-46). Tutkimus on usein etnografisesti suuntautunutta 
(ks. tarkemmin Lingvistinen etnografia toimintayhteisöissä tk.). Siinä 


tarkastellaan, miten kielen avulla jäsennetään ja tuotetaan sosiaalista 
todellisuutta ja kiinnitetään huomiota kielenkäytön historiallisiin tai 
kulttuurisiin taustoihin sekä kieli-ideologioihin (esim. Lehtonen 2015; 
Sorjonen, Rouhikoski & Lehtonen 2015; Vaattovaara & Poutiainen 2017). 

Sosiolingvistit ovat vuosikymmenten kuluessa tarkastelleet kieli- 
yhteisöjä monenlaisissa konteksteissa erilaisten aineistojen valossa. 
Teoreettista keskustelua on käyty erityisesti kielen ja yhteiskunnan suh- 
teen painottumisesta ja eri aikoina etenevien sosiaalisten prosessien 
läsnäolosta kielenkäytön muutosten analyysissa. Alan tutkimusta on 
esitelty lukuisissa teoksissa (ks. esim. Coupland 2007; 2016; Coupland 
& Jaworski 1997; Bayley, Cameron & Lucas 2013). 
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3. Sosiolingvistista tutkimusta 1970-luvulta 
2010-luvulle 


Seuraavissa luvuissa tarkastelemme suomalaisen sosiolingvistisen tutki- 
muksen eri vaiheita, lähestymistapoja ja menetelmiä — niiden kansain- 
välisiä esikuvia unohtamatta. Tarkastelu etenee osittain kronologisesti 
mutta tuo esiin myös sen, miten eri lähestymistavat ja menetelmät ovat 
kehittyneet ja miten samoja menetelmiä voi hyödyntää uusissa oloissa 
ja uusien aineistojen avulla — myös uusiin menetelmiin yhdistellen. Sa- 
moin aiemmin koottuja puhutun kielen aineistoja voi käsitellä uusista 
näkökulmista ja uusin menetelmin ja siten hyödyntää niitä uudelleen. 
Tarkastelumme punaisena lankana onkin se, että niin eri tilanteissa 
tallennettujen yksilö- ja ryhmähaastattelujen sekä muunlaisten vuoro- 
vaikutustilanteiden analysointi kuin kielenkäytön systemaattinen ha- 
vainnointi tarjoavat sosiolingvistiselle tutkimukselle mahdollisuuden 
erilaisiin näkökulmiin ja painotuksiin. Lähdemme liikkeelle variaation- 
tutkimuksesta ja etenemme kielenvaihdon ja kielensäilyttämisen 
analyysiin. Sen jälkeen käsittelemme vuorovaikutussosiolingvistiikan 
näkökulmia, kieliasenteiden tutkimusta ja monikielisten toiminta- 
yhteisöjen tutkimusta. 


3.1. Variaatio ja kielenmuutos 


Kaupunkipuhekielten variationistista tutkimusta on harjoitettu laaja- 
mittaisemmin 1960-luvun lopulta lähtien näihin päiviin asti erityisesti 
anglosaksisissa maissa (Labov 1966; Trudgill 1974), saksalaisella kie- 
lialueella (Kallmeyer 1987; 1994) ja pohjoismaissa (Nordberg 1971; 
1994; Thelander 19793; 1979b; Sundgren 2002). Aineistoa on koottu 
yleensä haastattelemalla useamman, tavallisesti kolmen, sukupolven 
kielenkäyttäjiä. Suomessa ensimmäinen laaja projekti oli edellä mai- 
nittu Nykysuomalaisen puhekielen murros, joka toteutettiin neljässä 
kaupungissa, Helsingissä, Tampereella, Turussa ja Jyväskylässä. Kai- 
kissa ympäristöissä tutkittiin ensisijaisesti äänne- ja muotovariaatiota 
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ja tarkasteltiin koulutukseltaan eritaustaisia ja eri ammateissa toimivia 
ihmisiä (Paunonen 1995 [1982]; Mielikäinen 1980; 1981b; 1981c; 1986; 
Jonninen-Niilekselà 1982; Suojanen M. K. 1985). Projektin tuloksena 
saatiin paljon tietoa suomalaisen kaupunkipuhekielen äänne- ja muoto- 
varianttien esiintymisestä sekä jonkin verran myös sanastollisesta (Jyväs- 
kylä) ja syntaktisesta (Turku) variaatiosta erilaisten aineistojen valossa. 


Variaationtutkimus 


Variaationtutkimuksen keskeisiä käsitteitä ovat variaabeli, variantti, va- 
rieteetti ja variaatio. Variantti on tutkittavan kielenpiirteen eli variaabelin 
ilmiasu; esimerkiksi yleiskielen ts:llä voi olla variantit ts, tt, t ja ht tai 
persoonapronominilla minä variantit minä, mä, mää, mie ja miä. Varie- 
teetilla tarkoitetaan kielimuotoa (esim. Liedon murre, Helsingin puhe- 
kieli). Käsite on ongelmallinen esimerkiksi siksi, että eri kielimuotojen 
rajat eivät ole selväpiirteisiä ja yksilö voi käyttää useita variantteja, joista 
osa on murretta, osa yleiskieltä. Variaatio tarkoittaa kielen vaihtelua il- 
miönä. Koska käsitteet ovat asultaan lähellä toisiaan, variantti ja varie- 
teetti ovat usein sekoittuneet jopa sosiolingvistisissä tutkimuksissa. 


Näissä kaikissa tutkimuksissa ja monissa muissa 1970- ja 1980-luvuilla 
tehdyissä sosiolingvistisissä analyyseissa perusmenetelmänä on 
näennäisaikametodi, joka Labovin (1994, 43-72) mukaan tarkoittaa 
sitä, että ikäryhmittäiset kielelliset erot heijastavat meneillään olevia 
kielenmuutoksia. Oletuksena on, että tiettynä ajankohtana tutkittujen 
nuorten puhetapa on heidän aikuistuessaan keski-ikäisten kielimuoto, 
samoin kuin keski-ikäisten kielimuoto olisi tulevien vanhusten kieli- 
muoto. Kuten Tommi Kurki on huomauttanut, metodi ei välttämättä 
sovi kaikkien kielen ilmiöiden tarkasteluun. Sitä paitsi idiolektit voivat 
ajan oloon muuttua ja sosiaaliset muutokset muuttaa tilannetta. (Kurki 
2005, 33-36.) On siten useita tekijöitä, jotka saattavat viedä kielen kehi- 
tystä aivan toiseen suuntaan kuin näennäisaikametodin avulla saatujen 
tulosten perusteella voisi olettaa. Varmimmin tällä metodilla saa tietoa 


872 PIRKKO NUOLIJÄRVI JA HANNA LAPPALAINEN 


kulloisenkin ajankohdan synkronisesta vaihtelusta ja eri ryhmien välisis- 
tä eroista, mikä tuo esiin kieliyhteisön diversiteetin. Sen avulla voi myös 
hahmotella hypoteeseja mahdollisista muutoksista. 

Useissa alkuvaiheen sosiolingvistisissä tutkimuksissa käsiteltiin 
syntyperäisten kieltä. 1980-luvulla Pohjoismaissa kiinnostuttiin maassa 
muuttaneiden kielestä, ja 1980-luvun alkupuolella Suomessa, Ruotsis- 
sa, Norjassa ja Tanskassa toteutettiin hanke Urbanisering och spräk- 
förändring i Norden, jossa tutkimuksen kohteena oli maalta kaupunkiin 
muuttaneiden kielimuoto. Keskeisenä tavoitteena oli selvittää, miten 
muuttajat säilyttävät lapsuuden kielimuotoaan ja miten he sopeutu- 
vat uuden ympäristön varioiviin kielimuotoihin ja omaksuvat niiden 
variantteja. Suomalaiset tutkijat analysoivat Helsinkiin muuttaneita 
suomenkielisiä (Nuolijärvi 1986a; 1986b) ja Suomesta Eskilstunaan 
muuttaneita ruotsinkielisiä (Ivars 1986), Ruotsissa tutkittiin niin ikään 
Eskilstunaan muuttaneiden ruotsinsuomalaisten kielimuotoa (Lainio 
1989). Samoin Norjassa ja Tanskassa tarkasteltiin maalta kaupunkiin 
muuttaneiden murteen säilymistä ja uusien varianttien omaksumista 
(Omdal 1994; Pedersen 1986). Kokonaiskuvan projektista saa Bengt 
Nordbergin (1994) toimittamasta artikkelikokoelmasta. 


Pirkko Nuolijärvi: Kenttätyötä ja variaationtutkimusta 1980-luvulla 


1980-luvun alussa käynnistyi pohjoismainen tutkimushanke 
Urbanisering och spräkförändring i Norden, jossa tutkittiin maalta 
kaupunkiin muuttaneiden kielimuotoa. Tässä hankkeessa syntyi myös 
ensimmäinen fennistiikan sosiolingvistinen väitöskirja, tutkimukseni 
Kolmannen sukupolven kieli. Helsinkiin muuttaneiden suurten ikäluokkien 
eteläpohjalaisen ja pohjoissavolaisten kielellinen sopeutuminen (Nuolijarvi 
1986b), ja sen sivutuotteena teos Kieliyhteisön vaihto ja muuttajan iden- 
titeetti (Nuolijärvi 1986a), jossa käsiteltiin muuttajien kokemuksia ja 
näkemyksiä kielimuodoista. Hanketta johti professori Bengt Nordberg 
Uppsalan yliopistosta. Suomessa tutkimusta rahoitti Suomen Akatemia. 


Työ käynnistyi vuoden 1982 alussa yhteisissä kokouksissa, joissa täs- 
mennettiin tavoitteita ja esiteltiin kunkin maan edustajien suunnitelmia. 
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Ennen aineistonkeruun käynnistämistä perehdyin sosiolingvistiseen kir- 
jallisuuteen ja menetelmiin. Eteläpohjalaiset ja pohjoissavolaiset suur- 
ten ikäluokkien edustajat valikoituivat haastateltaviksi kahdesta syystä: 
Ryhmät edustivat hyvin erilaisia lähtömurteita, joihin julkisessa keskus- 
telussa myös suhtauduttiin tuolloin eri tavoin. Toinen syy informanttien 
valintaan oli se, että suurelta osin juuri nämä ikäluokat toteuttivat niin 
sanotun suuren muuton eli muuttoliikkeen muualta Suomesta Etelä- 
Suomeen 1960-luvun lopulla ja 1970-luvun alussa. Haastateltavat etsin 
Väestörekisterikeskuksen tiedostojen avulla. Poimin rekisteristä henkilöi- 
tä, jotka olivat syntyneet vuosina 1943-1950 eteläpohjalaisen ja pohjois- 
savolaisen murrealueen kunnissa ja jotka asuivat Kalliossa, Alppilassa, 
Hermannissa, Vallilassa, Maunulassa ja Oulunkylässä. Sen jälkeen otin 
yhteyttä näihin henkilöihin, yleensä puhelimitse, mutta joskus astelin 
suoraan kotiovelle ja kysyin haastattelumahdollisuutta. Minulla oli pa- 
perilla lyhyt selvitys, mihin tarkoitukseen aineisto kerätään, mutta lupa 
kysyttiin tuolloin ainoastaan suullisesti. Vain yksi tavoittamani henkilö 
kieltäytyi. 


Teemahaastattelut tein haastateltavien kotona kelanauhurilla maalis- 
ja huhtikuussa 1982, ja ne kestivät tunnin (kysymyssarja ks. Nuolijärvi 
1986a; 1986b). Kaikkiaan haastatteluja oli 48, 24 kummaltakin murre- 
alueelta, miehiä ja naisia yhtä paljon. Henkilötiedot keräsin lomakkeelle. 
Samaan aikaan kun haastattelin iltaisin, litteroin aineistoa päivisin. Siten 
sain heti tuntumaa informanttieni kielimuotoon ja pystyin jo suunnitte- 
lemaan, mihin piirteisiin kannattaa kiinnittää huomiota. Oli hyödyllistä 
kerätä aineisto melko lyhyessä ajassa, jotta pääsi ripeästi käsiksi analyy- 
siin. Aineiston keruu ei ollut pelkkää materiaalin kokoamista, vaan sain 
eläytyä monenlaisiin elämäntarinoihin ja oppia paljon siitä, mitä muut- 
taminen merkitsi. Kesä- ja heinäkuussa nauhoitin vielä 12:ta informanttia 
heidän lapsuutensa ympäristössä, kun he keskustelivat isän, äidin tai 
ystävän kanssa. Näin sain aineistoa sekä kaupunki- että lomasuomesta 
eli aineistoa tilanteisen vaihtelun analyysin tarpeisiin. Aineiston keruu 
merkitsi siis lukuisia raitiovaunu- ja bussimatkoja melko painavan kela- 
nauhurin kanssa ja kesällä juna- ja automatkoja Etelä-Pohjanmaalle ja 
Pohjois-Savoon. 
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Analysoin noin 20 aanne- ja muotopiirteen vaihtelua koko aineistossa. 
Koska käytin tietokonetta vasta työn viimeistelyvaiheessa, varianttien 
poiminta oli manuaalista, piirre kerrallaan, yksilö kerrallaan. Rakensin 
kustakin variaabelista taulukoita ja etsin selityksiä varianttien jakautumi- 
selle. Tämä vaihe sisälsi siis paljon nauhojen kuuntelua ja litteraattien 
läpikäyntiä sekä myöhemmin sen miettimistä, miten parhaiten havain- 
nollistaa ryhmien ja yksilöiden välisiä eroja. Rakensin yksilöprofiileja ja 
ilokseni sain myöhemmin huomata, että yksilöihin keskittyminen ei ollut 
väärä valinta; siitä tuli myöhemmin itsestään selvä osa sosiolingvistisen 
tutkimuksen kaanonia. Pystyin äänne- ja muotovariaation perusteella 
erottamaan neljä erilaista yksilöprofiilia: murteenpuhuja, leimautumaton 
sopeutuja eli yleispuhekielisen valtakulttuurin suosija, kaupunkilaistunut 
sopeutuja eli uuden alakulttuurin omaksuja ja huolitteleva puhekielestä 
irrottautuja. Luonnollisesti keskeistä oli myös kahdelta murrealueelta 
tulevan ryhmän vertailu sekä miesten ja naisten valintojen vertailu. 


Pohjoismainen projektiryhmä tapasi säännöllisesti, ja vuorovaikutus 
tapahtui skandinaavisilla kielillä. Nämä tapaamiset olivat tärkeitä ja 
opettavaisia. Sen lisäksi, että oma työ sai aina uutta voimaa, opin tie- 
teellistä vuorovaikutusta yhteisössä, jonka jäsenet tulivat eri maista, eri 
yliopistoista ja erilaisista keskustelukulttuureista. Projekti oli hedelmällli- 
nen: sen tuloksena syntyi kaikkiaan seitsemän väitöskirjaa ja englannin- 
kielinen kokoomateos, jossa tuloksia esitellään artikkelimuodossa 
(Nordberg 1994). 


Koko väitöskirjaprosessin aikana toimin aktiivisesti paikallispolitiikassa, 
mikä vaikutti osaltaan siihen, että labovilaisen variaationtutkimuksen pe- 
rinteeseen kiinnittyvä väitöstutkimukseni oli yhteiskunnallisestikin kan- 
taa ottavampi kuin fennistiikassa oli siihen mennessä totuttu. Elinkeino- 
ja aluerakenteeltaan muuttuneessa Suomessa syntyivät erilaiset kielen 
markkinat, joilla jokaisen oli lunastettava oma paikkansa, ja tämän yritin 
välittää samalla, kun analysoin yksityiskohtaisesti yksilöiden ja ryhmien 
kielenkäyttöä. Tutkija ei ole irrallaan muusta elämästä, ja siksi jokaisen 
kannattaa mennä sitä kohti, minkä tuntee omimmaksi alueekseen. Eikä 
kannanottojakaan kannata pelätä. 
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1990-luvun alussa kaynnistettiin Kotimaisten kielten tutkimuskeskuk- 
sen koordinoima ja yliopistojen kanssa yhteistyössä toteutettu murteen- 
seuruuhanke. Kymmenellä Suomen maaseutupaikkakunnalla tarkastel- 
tiin vähintään kolmen sukupolven kielimuotoa. Paikkakunnat sijaitsevat 
eri puolilla Suomea, ja tavoitteena olikin saada selville, mihin suuntaan 
kielimuodot ovat kehittyneet eri ympäristöissä. (Kokoavat tulokset, ks. 
Nuolijärvi & Sorjonen 2005.) 2000-luvun alussa tehtiin uusi haastat- 
telukierros, ja tätä aineistoa tutkittiin myös reaaliaikametodilla (esim. 
Kurki 2005). 

Reaaliaikaisella näkökulmalla tarkoitetaan sitä, että samaa puhuja- 
yhteisöä tutkitaan kahtena tai useampana eri ajankohtana. Tyypillisim- 
min tutkimuskertojen väli on ollut 10-20 vuotta mutta joskus lyhyempi- 
kin. Reaaliaikaista tutkimusta on kahta eri tyyppiä: paneelitutkimuksella 
tarkoitetaan sitä, että tutkittavana ovat täsmälleen samat puhujayksi- 
löt, kun taas trenditutkimuksessa tutkittavat valitaan kaikilla aineiston- 
keruukerroilla samoin kielenulkoisin kriteerein, eivätkä yksilöt ole vält- 
tämättä samoja. Monissa tutkimuksissa näitä näkökulmia on yhdistelty. 
(Ks. esim. Paunonen, H. 1995; 1996; 2005; 2018; Kurki 2005; Palander 
2005; Mustanoja 2011; Sundgren 2002; Wagner & Buchstaller 2018). 

Trendi- ja paneelitutkimusten etu verrattuna näennäisaikatutkimuk- 
seen on se, että niiden avulla saadaan tietoa siitä, mihin suuntaan tar- 
kastelun kohteena olevat kielen ilmiöt ovat muuttuneet. Haasteena on 
kuitenkin erottaa se, mikä on todellista muutosta, mikä vain tilanteista 
vaihtelua. Erityisesti 2000-luvulla on kehitetty määrällisiä menetelmiä, 
jotta kielen muutosta ja variaatioon vaikuttavia tekijöitä pystyttäisiin ku- 
vaamaan mahdollisimman luotettavasti (esim. Kurki 2005; Mustanoja 
2011; Kuparinen, Mustanoja, Peltonen, Santaharju & Leino 2019; Lap- 
palainen, Mustanoja & O'Dell 2019). Tutkimukset ovat osoittaneet, 
etteivät idiolektit ole staattisia vaan erisuuntaiset muutokset ovat pi- 
kemminkin sääntö kuin poikkeus, myös myöhemmällä aikuisiällä. Fri 
yksilöillä muutokset ovat kuitenkin erisuuntaisia ja kumoavat toisensa 
niin, että yhteisötasolla muutos ei useinkaan ole radikaali (Mustanoja 
2011). Reaaliaikatutkimusten huonona puolena on tutkimusten työläys, 
pitkä aikajänne ja se, että ensimmäisen vaiheen ratkaisut voivat rajoit- 
taa toisen vaiheen ratkaisuja. Tällaisia tutkimuksia on tehty Suomessa 
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1990-luvulta lähtien, mutta nyt kun sosiolingvistiikalla on jo kymme- 
nien vuosien historia ja aiempia aineistoja on kertynyt runsaasti, tällai- 
selle pitkittäistutkimukselle on aiempaa paremmat edellytykset. 
Kaikkineen määrällisillä menetelmillä on ollut kansainvälisessä 
sosiolingvistiikassa keskeinen sija. Labov kehitteli tutkimusryhmineen 
jo 1970-luvulla Varbrul-monimuuttujamenetelmän, jolla voidaan sel- 
vittää samanaikaisesti useiden muuttujien selitysvoimaa. Menetelmä 
palvelee sosiolingvistiikan keskeisiä lähtökohtia yhdistäessään vaihtelun 
sosiaalisen ja lingvistisen ulottuvuuden, sillä analyysissa on mahdolli- 
suus tarkastella sekä kielenulkoisia (esim. ikä, sukupuoli) että kielen 
sisäisiä (esim. äänneasema) muuttujia. Varbrulin pohjalta on kehitetty 
myöhemmin Goldvarb-niminen menetelmä. (Esim. Tagliamonte 2006.) 
Suomalaisessa sosiolingvistiikassa tilastollisia menetelmiä on sovel- 
lettu vasta 2000-luvulla, ensimmäisenä Tommi Kurki (2005), joka on 
hyödyntänyt Varbrul-ohjelmaa tutkiessaan Alastaron murteen muutos- 
ta reaaliaikaisen aineiston valossa. Muita suomalaisessa sosiolingvistii- 
kassa hyödynnettyjä tilastomenetelmiä ovat bayesilainen menetelmä, 
jossa keskeistä on todennäköisyyden tulkinta (esim. Mustanoja 2011), 
sekä päätöspuumenetelmä (engl. detection tree), joka on Varbrulin tavoin 
monimuuttujamenetelmä ja josta on edelleen kehitetty niin sanottu sa- 
tunnaismetsämenetelmä (engl. random forest; ks. esim. Priiki 2017; ks. 
myös Määrällinen korpuslingvistiikka tk.). Tilastomenetelmien käyttö 
on paitsi antanut pohjaa sen tulkinnalle, millainen variaatio on tulkit- 


tavissa muutokseksi (esim. Mustanoja 2011), myös paljastanut sellaisia 
muuttujia, joiden merkitystä olisi vaikeaa tunnistaa muilla tavoilla. Jäl- 
kimmäisestä sopii esimerkiksi Katri Priikin väitöstutkimus (2017), jossa 
hän osoittaa, että kaakkoissatakuntalaisessa puheessa 3. persoonan pro- 
nominien vaihtelua keskeisesti säätelevä tekijä on virittyneisyys (engl. 
priming) eli se, mitä pronominia on edellä käytetty samasta tarkoitteesta. 
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3.2. Kielenvaihto ja kielen säilyttäminen kielisosiologian 
näkökulmasta 


Erityisesti kielivähemmistöt ja alkuperäiskansat, joiden kielellä on vä- 
hemmän puhujia ja heikompi juridinen asema kuin enemmistökielellä, 
joutuvat jatkuvasti kamppailemaan oman kielensä säilymisen puoles- 
ta. Kun virallisessa vuorovaikutuksessa ja kodin ulkopuolella käytetään 
hallitsevan väestön kieltä, jää oman kielen käyttöala vähäiseksi ja kie- 
len säilyminen on uhanalainen. Eri kieliryhmien tilannetta Euroopan 
maissa on tutkittu ELDIA-hankkeessa (European Language Diversity for 
All) ja kehitetty kielibarometri tilanteen kuvaamiseksi ja seuraamiseksi 
(Laakso, Sarhimaa, Spiliopoulou Äkermark & Toivanen 2016; ks. myös 
Sarhimaa 2017). Alkuperäiskansan tai vähemmistökielisten olot voivat 
nyky-yhteiskunnassa muuttua suurestikin, kuten Helsingin saame- 
laisilla (Lindgren 2000) tai Pietarin seudun inkeriläisillä, jotka elävät 
venäjänkielisen yhteisön keskellä (Mononen 2013). 

Kielenvaihdon problematiikkaa ja edellytyksiä on käsitelty nimen- 
omaan kielisosiologisesta näkökulmasta (varhaisista tutkimuksista ks. 
esim. Fishman 1972). Usein tutkimus on kiinnittänyt huomionsa vain 
yhteen aikatasoon ja tarkastellut kielen tilannetta synkronisesti. Kielen- 
vaihto ei kuitenkaan tapahdu hetkessä, vaan se voi toteutua usean 
sukupolven aikana. Kaksikielisyyden tutkija Einar Haugen luonnehti 
aikanaan kielenvaihdon prosessia kielenvaihdon kierteeksi: Yksikieli- 
sestä vähemmistökielisestä yksilöstä tai ryhmästä tulee vähitellen kaksi- 
kielinen, kun kontakti toisenkieliseen yhteisöön on jatkuvaa. Ajan oloon 
alun perin vieras kieli valtaa sitten sijaa yksilön tai ryhmän elämässä, ja 
kielenvaihto on alkanut. Lopulta alkuperäisen kielen käyttö vähenee ja 
äärimmäisessä tapauksessa loppuu kokonaan. (Haugen 1980.) Samas- 
sakaan yhteisössä kaikille yksilöille ei kuitenkaan käy samalla tavoin, 
vaan osa yksilöistä voi säilyttää kielensä. Haugenin kuvaus ei kuitenkaan 
oikein vastaa todellisuutta, koska vähemmistökieliset yksilöt vain har- 
voin ovat yksikielisiä. Sen sijaan se havainto, että yksilöiden kielellinen 
historia on erilainen, pitää paikkansa. 

Suomessa kielenvaihdon kierrettä ovat tutkineet muiden muassa Mar- 
jut Aikio ja Marika Tandefelt. Muualle muuttaneiden suomenkielisten 
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kielenvaihtoa on selvitetty australiansuomalaisten keskuudessa (ks. 
esim. Kovacs 2004), ja suomenkielisten vähemmistöjen tilannetta on 
kuvattu myös monissa muissa ympäristöissä (ks. esim. Jönsson-Korhola 
& Lindgren 2003). 

Aikio (1988) on käsitellyt viiden saamelaiskylän kielenvaihtoa vuo- 
sina 1910-1980 ja Tandefelt (1988) ruotsinkielisen suvun kolmen 
sukupolven kielenvaihtoa ja kielen säilyttämistä Vantaalla (Helsingin 
pitäjässä). Aikio kehitti työssään kolmenlaisia indeksejä, joiden avul- 
la hän tarkasteli ja vertaili informanttiryhmiään: perusindeksinä on 
kielenkäyttöindeksi, ja muut kaksi indeksiä ovat kielen ymmärtämis- 
indeksi ja kielitaitoindeksi. Kielenvalintaa Aikio tarkasteli sisarussarjoit- 
tain, kylittäin, sukupolvittain ja perheittäin. Lisäksi hän valitsi lähem- 
män tarkastelun kohteeksi muutamia avaininformantteja. 

Tandefeltin tutkimus on sosiolingvistisempi, ja se käsittelee variaation- 
tutkimusten tapaan joukkoa kielenpiirteitä, joiden kehitystä tarkastellaan 
siltä kannalta, miten murre muuttuu standardikielisemmäksi. Toinen nä- 
kökulma koskee sitä, miten kieli vaihtuu ruotsista suomeksi. Vantaalais- 
ympäristössä saman, alkuaan yksikielisen suvun jäsenet erkaantuvat 
tulosten mukaan kahteen suuntaan: osa vaihtaa kielensä, osa säilyttää 
ruotsin suomen kielen rinnalla. Tandefeltin tutkimus pohjautuu Finar 
Haugenin (1971) ajatuksiin kielen säilyttämiseen vaikuttavista tekijöistä. 


Kielenvaihto suvuissa 


Eri sukuhaarojen kielenvaihtoa tai kielen säilymistä voi kuvata, kuten 
Tandefelt väitöstutkimuksessaan (1988), esimerkiksi seuraavin sym- 


bolein': 
Sukupolvi A B € D E 
1) Ab > Ab > AB > AB > (AB) 
2) Ab > AB > AB > AB > (AB) 
3) Ab > Ab > AB > BA > B 
4) Ab > Ab > AB > Ba > B 
5) Ab > Ab > AB > B > B 
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Sukupolven A pääasiallinen kieli on ruotsi (A). Sukupolvessa B on yksi 
yksilö (2), jolla kielet ovat yhtä vahvoja. Sukupolvessa C kielten tasa- 
vahva asema koskee kaikkia puhujia (1-5). Sukupolvessa D näkyy eriy- 
tyminen: osalla kielet ovat yhtä vahvoja, mutta suomi (B) voi olla ensi- 
sijainen (esim. yksilöt 3 ja 4), jolloin ruotsi jää vähemmälle käytölle (a) 
tai sitä ei enää käytetä (yksilö 5). Sukupolvessa E suomi on vallannut 
tilan ruotsilta tai molempia käytetään yhtä paljon. 


Mainitun kaltaiset tutkimukset ovat metodeiltaan rikkaita. Kieli- 
sosiologinen tarkastelu vaatii sekä tutkittavan ympäristön ja sen his- 
torian tarkkaa tuntemusta että sosiolingvististen ja kielisosiologisten 
menetelmien yhdistelyä ja kehittämistä kulloisenkin analyysin tarpei- 
siin. Nykyoloissa esimerkiksi sukupolvi sitten maahan tulleiden moni- 
kielisten yksilöiden kielenvaihto voi olla vielä nopeampaa kuin Aikion 
ja Tandefeltin tutkimien ryhmien ja yksilöiden kielenvaihto. Tämä vaatii 
yhä enemmän menetelmien kehittämistä ja asianomaisten kieliryhmien 
olojen tuntemusta. 


3.3. Variaatio ja vuorovaikutus 


2000-luvulta lähtien suomalaista variaationtutkimusta on rikastanut 
myös vuorovaikutuksen näkökulma. Ensi kertaa se oli mukana Pirkko 
Nuolijärven ja Liisa Tiittulan (2000) poliittisia televisiokeskusteluja 
koskevassa tutkimuksessa, jossa variaatiota ja vuorovaikutusta tarkas- 
teltiin selvästi erikseen mutta kuitenkin samasta aineistosta ja saman 
tutkimuksen puitteissa. Selvemmin niitä yhdistettiin Hanna Lappalai- 
sen väitöskirjassa (2004), jossa variaation funktioille etsitään selityksiä 
vuorovaikutuskontekstia analysoimalla. Pyrkimyksenä on nähdä nume- 
roiden taakse ja tutkia, mitkä muut kuin kielenulkoiset tekijät voivat 
selittää kielellistä vaihtelua. Lappalaisen tutkimuksessa muun muas- 
sa ilmeni, että koodinvaihdoilla arkisesta puhekielestä hyperkorrektiin 
yleiskieleen oli tutkitussa ryhmässä selviä vuorovaikutustehtäviä ja niillä 
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esimerkiksi osoitettiin toiseen rooliin tai toimintoon siirtymistä. Metodi- 
sesti tutkimuksessa nojaudutaan keskustelunanalyysiin (ks. myös esim. 
Lappalainen 2006; 2011; keskustelunanalyysista ks. Keskustelunanalyysi 


ja vuorovaikutuslingvistiikka tk.). 


Koodinvaihto 


Lappalainen (2004) on osoittanut väitöskirjassaan, miten keskustelijat 
voivat siirtymällä tavanomaisesta puhekielisestä ilmaisutavastaan ko- 
rosteisen yleiskieliseen puhetapaan ilmentää monenlaisia kontrasteja 
ja osoittaa vuorovaikutustilanteessa tapahtuvaa muutosta. Esimerkiksi 
kun lapsi temppuilee ruokapöydässä vieraiden läsnä ollessa eikä äiti saa 
häntä tottelemaan, isän huolitellun yleiskielisesti esittämän lausuman 
”mitä vielä keksimme sinua uhkaillessa” voi tulkita yritykseksi keventää 
tilannetta ja käsitellä sitä humoristisesti. Äiti ei kuitenkaan tähän tarjouk- 
seen tartu vaan jatkaa samassa vakavassa moodissa, ja näin konflikti 
jatkuu. Tilanteissa, joissa muutkin osallistujat kuin koodinvaihtoa käyt- 
tänyt puhuja siirtyvät samaan puhetapaan, yleiskielen käyttö voi toimia 
yhteisyyden rakentamisen keinona. 


2010-luvulla variaation ja vuorovaikutuksen näkökulmia yhdistävät tutki- 
jat ovat nimenneet tutkimuksensa vuorovaikutussosiolingvistiikaksi (ks. 
esim. Mononen 2013; Lehtonen 2015; Rouhikoski 2015; Priiki 2017). Sille 
on ominaista tutkia, mitä variaatiolla tehdään vuorovaikutuksessa ja mil- 
laisia merkityksiä vuorovaikutustilanteen osallistujat variaatiolle antavat. 
Tutkimuskohteena ovat olleet niin arkiset kuin institutionaaliset tilanteet 
ja sekä yksi- että monikielinen vuorovaikutus. Tutkittavat ilmiöt ovat moni- 
puolistuneet jo osin siksi, että haastattelujen lisäksi aineistona ovat olleet 
muunkinlaiset vuorovaikutustilanteet. Vuorovaikutussosiolingvistiikka on 
tehnyt näkyväksi sen, että eri puhetilanteiden vertailun lisäksi on tarkastel- 
tava vaihtelua myös vuorovaikutustilanteiden sisällä, mikrotasolla, samalla 
kuitenkin pohtien sen kytköksiä makrotasolle. Vaihtelun selittämisessä 
on hyödynnetty esimerkiksi diskurssi-identiteetin, osallistumiskehikon (engl. 
participation framework) ja asennoitumisen (engl. stance) käsitteitä. 
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3.4. Variaatioon liittyvät käsitykset, asenteet ja ideologiat 


Kieliasenteista ja -käsityksistä oltiin kiinnostuneita jo suomalaisen 
sosiolingvistiikan alkuvaiheissa (esim. Mielikäinen 19813; Nuolijärvi 
1986a), mutta laajamittaisemman ja systemaattisemman tutkimuksen 
kohteeksi ne ovat nousseet tällä vuosituhannella. Tähän on vaikuttanut 
erityisesti kansanlingvistisen tutkimuksen rantautuminen Suomeen. 
Kansanlingvistiikassa lähtökohtana on tavallisten kielenkäyttäjien kieli- 
käsitysten ja -asenteiden tarkastelu. Niitä tutkitaan erilaisin menetel- 
min, kuten kuuntelutesteillä (esim. murrenäytteiden paikantaminen), 
kysymällä suoraan eri kielimuotoihin liittyvistä arvotuksista, piirrättä- 
mällä murrekarttoja ja pyytämällä tutkittavia nimeämään murrealueita 
ja -piirteitä ja imitoimaan jotain kielimuotoa. Näillä menetelmillä on 
saatu tietoa esimerkiksi siitä, millaisiin kielenpiirteisiin kielenkäyttä- 
jät kiinnittävät omassa murteessaan ja muiden murteissa huomiota, 
miten murrealueita hahmotetaan maantieteellisesti ja mitä murteita 
pidetään kauneimpina. Keskeinen tutkimuskohde on myös metakieli 
eli se, miten kielenkäyttäjät eri kielenilmiöistä puhuvat, kun heillä ei 
luonnollisestikaan voi olla samoja käsitteitä hallussaan kuin ammatik- 
seen kieltä analysoivilla tutkijoilla. (Preston 1989; 1999; Long & Preston 
2000; Vaattovaara 2009; Palander 2011; Mielikäinen & Palander 2014; 
Kurki 2018; Vaattovaara, Kunnas & Saviniemi 2018.) Kielenpiirteiden 
variaatiota, leimautumista ja nykysuomen murteiden jäsentymistä on 
tarkasteltu myös kielellisen identiteetin rakentumisen näkökulmasta 
(Mantila 2004). 


Kieliasenteet 


Johanna Vaattovaara on väitöstutkimuksessaan (2009) osoittanut, 
että kieliasenteiden dynamiikka kuuluu variaationtutkimuksen ytimeen 
eikä ole siitä irrallinen ilmiö. Kielitietoisuuden analyysi yhdistettynä 
variaationanalyysiin voi murtaa annettujen sosiolingvististen katego- 
rioiden (ikä, sukupuoli, koulutus yms.) luomia stereotypioita kuten Tor- 
nionlaaksossa: murteelle ominaisen h:n käytöllä ei rakenneta maskulii- 
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nisuuden merkityksiä, kuten aiemmin on oletettu, vaan sillä viestitään 
sitoutumista kotiseutuun, mikä on yleisempää nuorten miesten kuin 
nuorten naisten keskuudessa. 


Kansanlingvistisen tutkimuksen tavoitteena on päästä käsiksi kielen- 
käyttäjien kielelliseen tietoisuuteen ja sitä kautta saada myös ymmär- 
rystä kielen muuttumiseen vaikuttavista tekijöistä. Taustalla on vahvasti 
spatiaalinen ajattelu, jossa kielen oletetaan olevan kytköksissä paikkaan. 
Vaikka kielen ja paikan suhde on monin tavoin olennainen, tätä näke- 
mystä on myös kritisoitu turhan kapeana: kieleen kytkeytyvät mielikuvat 
voivat olla sidoksissa jopa paljon enemmän johonkin muuhun ulottu- 
vuuteen kuin paikkaan. Yksi esimerkki tästä on niin sanottu stadilainen 
ässä, johon liittyy paljon muitakin sosiaalisia merkityksiä kuin kytkös 
pääkaupunkiseutuun. (Vaattovaara 2014; Vaattovaara & Halonen 2015.) 
Vuorovaikutuksen, asenteiden ja ideologioiden erittely onkin tärkeä osa 
kielentutkijoiden yhteiskunnallista vaikuttamista ja kielenkäyttäjien kieli- 
tietoisuuden vahvistamista (ks. esim. Piippo, Vaattovaara & Voutilainen 
2016). Kansanlingvistisen tutkimuksen lisäksi Suomessa on tehty muun- 
laistakin tutkimusta, jolla on pyritty selvittämään kieliasenteita ja -käsi- 
tyksiä (esim. Peterson & Vaattovaara 2014). Yksi keskeisistä tutkimus- 
menetelmistä on ollut verkossa toteutettu kyselytutkimus (ks. Kysely tk.). 

Suhde standardikieleen sekä sen ja muiden kielimuotojen varianttien 
vaihtelu on alusta pitäen ollut sosiolingvistisen tutkimuksen kohteena 
- samoin kuin normit ja niiden luonne (ks. esim. Piippo 2012). Tietoi- 
suus standardikielen piirteistä ja mielipiteet sen ja murteiden suhteesta 
ovat myös asennetutkimusten keskeisiä sisältöjä. 1990-luvulta lähtien 
on sosiolingvistiikassa kiinnitetty runsaasti huomiota siihen, että ny- 
kyisissä kieliyhteisöissä on meneillään kehityskulkuja, jotka asettavat 
standardikielen käsitteen uuteen valoon. Kysymys on siitä, miten kieli- 
asenteet muuttuvat, miten median vaikutus näkyy kielenkäyttäjien valin- 
noissa ja miten puhutun kielen piirteet vahvistuvat myös niin sanotussa 
korrektissa kielenkäytössä (engl. ”best language”) samoin kuin erilaisis- 
sa kirjoitetuissa tekstilajeissa. Näitä seikkoja on tarkasteltu lukuisis- 
sa tutkimuksissa. Yhtenä esimerkkinä mainittakoon eurooppalainen 
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SLICE-ohjelma (Standard Language Ideology in Contemporary Europe), 
joka on käsitellyt eri maiden kieliyhteisöjen kehitystä tästä näkökulmas- 
ta. Keskeisiä käsitteitä tämän ohjelman tutkimuksissa ovat destandardi- 
saatio ja demotisaatio (ks. esim. Kristiansen & Coupland 2011; Maegaard, 
Gregersen, Ouist & Jorgensen 2009). Destandardisaatio merkitsee etään- 
tymistä standardikielestä, demotisaatio puolestaan tarkoittaa sitä, että 
standardikieltä käytetään entistä laajemmin, ilman että sen status tai 
kieli-ideologiat muuttuvat. Demotisaatiosta on kyse esimerkiksi silloin, 
kun standardi korvaa murteet niiden aiemmissa käyttöyhteyksissä. 

Kuvaava esimerkki standardin muuttumisesta on Tanskasta, jossa 
Kööpenhaminassa käytetyt variantit ovat asettuneet osaksi muualla elä- 
vien nuorten standardia. Kysymys on eräänlaisesta kööpenhaminalais- 
varieteetin keskiverrosta, ei kaikkein leimallisimmasta pääkaupunkilais- 
puheesta (Kristiansen 2000). Suomessakin on nähtävissä samantapaisia 
ilmiöitä; näitä ei kuitenkaan ole käsitelty erityisesti destandardisaation 
näkökulmasta vaan osana paikallisten kielimuotojen muutoksen ku- 
vausta (ks. kuitenkin Nuolijärvi & Vaattovaara 2011). 


3.5. Kieli ja vuorovaikutus monikielisissä 
toimintayhteisöissä 


Suomi on ollut kautta aikain monikielinen maa, ja eri kieliä on käytetty 
rinnakkain ja lomittain. Yksi kiintoisa esimerkki tästä on Stadin slangi, 
joka on syntynyt suomen ja ruotsin kohtaamisesta (ks. esim. Paunonen, 
H. & Paunonen, M. 2000). Viime vuosikymmenten muuttoliikkeessä 
uutta on kuitenkin se, että varsin lyhyessä ajassa maahamme on tul- 
lut huomattava määrä kymmenien eri kielten puhujia ja varsinkin pää- 
kaupunkiseudulla on alueita, joilla maahanmuuttajataustaisten osuus 
on suuri. Frityisesti tämä näkyy kouluissa, joihin on muodostunut 
monikielisiä toimintayhteisöjä. Näissä yhteisöissä eritaustaiset osallis- 
tujat voivat jakaa kielellisiä resurssejaan ja hyödyntää vuorovaikutuk- 
sessaan sellaisia kieliä, joita eivät varsinaisesti osaa. Tällaista kielellisten 
resurssien hyödyntämistä kutsutaan kielenylitykseksi. Päästäkseen selville 
erilaisiin kielellisiin resursseihin linkittyvistä sosiaalisista merkityksistä 
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tutkijan on usein vietettävä runsaasti aikaa tutkimassaan yhteisössä. 
Etnografisella tutkimusotteella onkin keskeinen sija tämäntyyppisessä 
monikielisyyden tutkimuksessa. (Rampton 1995; 2006; Lehtonen 2015: 


ks. myös Lingvistinen etnografia toimintayhteisöissä tk.) 

Monikielisten yhteisöjen tutkimuksessa kieltä on tarkasteltu toimin- 
tana, ei staattisena oliona, ja siinä on irtaannuttu varieteetin käsitteestä, 
jota on kyseenalaistettu myös jo aiemmassa sosiolingvistisessä keskus- 
telussa (ks. esim. Nuolijärvi 2001). Monikielisten ryhmien analyysissa 
toimintayhteisön vuorovaikutus ja kielellisten taitojen hyödyntäminen 
pääsevät esille systemaattisesti, kun tutkitaan kahta tai useampaa kieltä 
sujuvasti käyttävien puhujien välistä vuorovaikutusta. Kysymys on jäl- 
leen kielen muutoksen tutkimuksesta: mitä tapahtuu, kun eri kielten 
puhujat ovat vuorovaikutuksessa samassa ympäristössä, kuten koulu- 
luokassa tai harrastuspiireissä? 


Sosiaalinen indeksi 


Eri kielten puhujien läheinen vuorovaikutus voi näkyä hyvin konkreet- 
tisesti, kuten Heini Lehtonen osoittaa väitöstutkimuksessaan (2015). 
Monietnisissä nuorisoryhmissä kiinteästi liikkuvat helsinkiläiskoululai- 
set käyttävät kielitaustastaan riippumatta ilmausta wallahi ' (vannon) 
Allahin nimeen’ ja sen suomenkielisiä vastineita mä vannon ja mä lupaan 
samaan tapaan kuin vastaavia ilmauksia käytetään monissa muissakin 
maissa. Lehtosen mukaan ne toimivat sosiaalisina indekseinä hänen 
tutkimiensa nuorten vuorovaikutuksessa. 


Monikielisyys ei ole siten vain eri kielten olemassaoloa kielenkäyttäjien 
elämässä vaan toimintaa monenlaisilla kielellisillä resursseilla ja niiden 
vaikutusta toisiinsa arjen vuorovaikutustilanteissa. Ilmiö ei sinänsä ole 
mitenkään uusi, mutta Suomen oloissa muutos näkyy siten, että yhä 
uudet kielet vaikuttavat myös suomenkielisten kielenkäyttöön. Toiminta- 
yhteisöjen etnografinen tutkimus kiinnittää huomiota erilaisten kielel- 
listen resurssien yhdistämiseen ja sen funktioihin eri tilanteissa. Tätä 
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suuntausta voi nimittää myös globalisaation sosiolingvistiikaksi (Blommaert 
2010; ks. myös Lehtonen 2015, 27). Sen keskeinen käsite on superdiver- 
siteetti; yhdessä yhteisössä käytetyt kielet eivät ole erillisiä eivätkä kielten 
rajat selviä, vaan yksilöiden kielelliset repertuaarit koostuvat erilaisista 
resursseista, joita voidaan hyödyntää joustavasti samassa tilanteessa. Kun 
tietyt resurssit kimputtuvat ja saavat sosiaalisia merkityksiä eli sosiaalis- 
ta indeksisyyttä, ne muodostavat tyylejä — tyypillisesti yhdessä muiden 
semioottisten resurssien kanssa. Prosessia, jossa tällaiset sosiaalisesti 
tunnistettavat tyylit tai rekisterit syntyvät ja muokkautuvat, kutsutaan re- 
kisteriytymiseksi. Rekisteriytyminen on jatkuva prosessi, vaikka se kiinnit- 
tyy aina myös aikaan ja paikkaan. (Agha 2007; ks. Lehtonen 2015, 35-50.) 


4. Yhteenveto 


Tässä artikkelissa olemme esitelleet erityisesti niitä sosiolingvistiikan 
suuntauksia, jotka 1970-luvulta alkaen ovat olleet edustettuina suomen 
kielen tutkimuksessa. Suuntauksista näennäisaika- ja reaaliaikametodia 
käyttävä, äänne- ja muotopiirteitä tarkasteleva variaationanalyysi on 
keskeisessä osassa. Myös sosiolingvistisen variaationanalyysin yhdis- 
täminen vuorovaikutuksen tutkimuksen menetelmiin on ollut suh- 
teellisen yleistä. Se selittyy osin siitä, että Suomessa on vahva, erityi- 
sesti keskustelunanalyysin menetelmin harjoitettu vuorovaikutuksen 
tutkimus, joka on ollut omiaan tukemaan myös sosiolingvistien työtä. 
Niin ikään kielellisten asenteiden tutkimus on saanut jalansijaa, ja 
kiinnostuksen kohteena ovat olleet erityisesti käsitykset eri murteista 
ja puhutun kielen muodoista sekä niiden hierarkiasta. 2010-luvulla 
on lisääntynyt myös monikielisten yhteisöjen etnografinen tutkimus, 
joka kohdistaa huomionsa erikielisten, samassa yhteisössä elävien ih- 
misten kielenkäytön ilmiöihin ja siihen, miten eri kielet vaikuttavat 
toisiinsa. Selvästi kielisosiologiset lähestymistavat ovat jääneet viime 
aikoina vähemmälle, mutta uudenlaisen monikielisyyden keskellä kieli- 
sosiologinen ote tulee varmasti vahvistumaan. 
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Menetelmien ja aineistojen monipuolistuminen avaa yhä uusia näky- 
miä sosiolingvistiselle tutkimukselle. Kuten sosiolingvistit Jan Blommaert 
ja Ben Rampton (2011) ovat huomauttaneet, sosiolingvistiikan tulee rea- 
goida yhteiskunnan muutoksiin. Keskiöön on nostettava liikkuvuus, se- 
koittuminen, poliittinen dynamiikka ja historiallinen kehys siten, kuin 
ne ilmenevät kielissä ja vuorovaikutustilanteissa nyky-yhteiskunnassa. 

Aineistoja on mahdollista koota nykyisin hyvin monista eri lähteis- 
tä; laajoja kirjoitetun ja puhutun kielen korpuksia on helposti saatavilla 
enemmän kuin koskaan. Tällaisia korpuksia ovat esimerkiksi Nyky- 
suomalaisen puhekielen murroksen aineisto, Helsingin puhekielen 
pitkittäiskorpus, Kotimaisten kielten keskuksen Murteenseuruukor- 
pus ja uusimpana Sata suomalaista kielellistä elämäkertaa -korpus (ks. 
Priiki, Mononen & Lappalainen 2018), jotka kaikki ovat Kielipankissa 
tai tulossa Kielipankkiin. Siten esimerkiksi tutkimuksen fokusoiminen 
yhteen piirteeseen onnistuu eri aineistoja ja näkökulmia hyödyntäen. 
Laajat aineistot myös luovat entistä paremman perustan kvantitatii- 
visten menetelmien käytölle ja kehittämiselle. Eri kielentutkimuksen 
metodeja yhdistellään todennäköisesti yhä enemmän, ja eri alojen rajat 
voivat siten madaltua. Yksittäisten kielellisten muuttujien sijasta sosio- 
lingvistiikassakin keskitytään enemmän vuorovaikutuksen tyyleihin 
ja etsitään kielellisille eroille selityksiä elämäntavoista ja tilanteisista 
seikoista. Koska sosiolingvististä analyysia on tehty jo useiden vuosi- 
kymmenien ajan ja aineistoa on tarjolla eri aikakausilta, on hyvät lähtö- 
kohdat myös reaaliaikaiselle tutkimukselle, jonka ansiosta on mahdol- 
lista saada entistä tarkempi kuva kielen kehityksestä. Yhä enemmän on 
tarvetta yhdistää lingvististä analyysia muihin tieteenaloihin, esimer- 
kiksi yhteiskuntatieteisiin, koska on ilmeistä, että kielenkäytön luokka- 
analyysille on uudenlainen tilaus eriarvoisessa tiimalasiyhteiskunnassa, 
jossa rikkaiden ja köyhien elämät ja vuorovaikutus erkanevat toisistaan 
entistä leimallisemmin myös Suomessa. 

Sosiolingvistiikan tuloksia voi soveltaa monissa yhteyksissä. Kielen 
ja vuorovaikutuksen variaatio koskettaa kaikkia yhteiskunnan tasoja. 
Sosiolingvistit voivat työllään lisätä päiväkotien ja koulujen henkilös- 
tön tietämystä erilaisista elämäntyyleistä ja puhetavoista, viranomais- 
ten ja median viestintä hyötyy eri aineistoilla tehdyistä tutkimuksista, 
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ja yritysten viestintä tarvitsee tietoa monentasoisesta variaatiosta ja 
kielenkäytön muutoksista. Tämä kaikki edellyttää tutkimuksen jatkuvaa 
yleistajuistamista ja aktiivista toimintaa myös tiedeyhteisön ulkopuo- 
lella. Hyvänä esimerkkinä tästä on yhteisölähtöinen toimintatutkimus 
”Itä-Helsingin uudet Suomen kielet”, jossa tutkijat tekevät näkyväksi 
tutkimassaan yhteisössä ilmenevää monikielisyyttä ja luovat käytäntöjä, 
joilla tätä erilaisten kielten taitoa voitaisiin yleisemminkin hyödyntää 
paremmin suomalaisessa yhteiskunnassa (ks. Lehtonen & Räty 2018). 
Sosiolingvistiikka on ylipäätään niitä kielentutkimuksen alueita, joiden 
tuloksia on suhteellisen helppo välittää esimerkiksi opetuksessa ja näin 
vahvistaa eri ryhmien ja yksilöiden kielitietoisuutta. 
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VIITTEET 


1 A-E=sukupolvet; 1-5 = yksilöt; A = ruotsi, B = suomi; suuraakkonen = vahvempi kieli 
puhujalla, pienaakkonen = heikompi kieli puhujalla; aakkosten järjestys = ensisijainen ja 
toissijainen kieli. 
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Mikä? 


Keskustelunanalyysissa ja vuorovaikutuslingvistiikassa tutkitaan kieltä 
ja vuorovaikutusta erilaisissa sosiaalisissa tilanteissa ja yhteiskunnan 
eri alueilla. Kiinnostus kohdistuu siihen, miten ihmisten välinen vuoro- 
vaikutus, toiminta ja yhteisymmärrys rakentuvat: kieltä tutkitaan sosiaa- 
lisen vuorovaikutuksen ja toiminnan jäsentymisen kautta. Tutkimus 
voi koskea esimerkiksi vaihtoehtoisia kielellisiä tapoja muotoilla tietty 
toiminto tai toimintajakso, kielen suhdetta muihin vuorovaikutuksen 
resursseihin, kielellisiä kategorioita vuorovaikutuksen näkökulmasta tai 
jonkin vuorovaikutustilanteen kokonaisuuden jäsentymistä. 
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Katso myös: 

Johdannon luku 4. Kielitieteen etiikka — hyvä tutkimus murroksessa 
Luku 4 Kokeellinen fonetiikka 

Luku 5 Lingvistinen etnografia toimintayhteisöissä 

Luku 6 Diskurssianalyysi 

Luku 20 Tekstintutkimus 


Luku 21 Sosiolingvistiikka 


1. Johdanto 


Keskustelunanalyyttisen ja vuorovaikutuslingvistisen tutkimuksen 
kohteena on sosiaalinen vuorovaikutus ja kieli erilaisissa tilanteissa ja 
yhteiskunnan alueilla — esimerkiksi aamiaisella kotona, isoäidin syn- 
tymäpäivillä, sairaalan lääkärinkierrolla, työvoimatoimistossa, luokka- 
huoneessa, televisiokeskustelussa, internet- tai lautapeliä pelattaessa. 
Keskustelunanalyyttisia ja vuorovaikutuslingvistisiä menetelmiä voi so- 
veltaa myös kirjoitetun vuorovaikutuksen tutkimukseen (esim. kauno- 
kirjallinen dialogi, WhatsApp- ja muu pikaviestiminen). Näillä kahdella 
tutkimussuuntauksen nimellä viitataan hieman erilaisiin tutkimusnäkö- 
kulmiin ja -perinteisiin. Keskustelunanalyysi on lähtöisin sosiologiasta, 
kun taas vuorovaikutuslingvistiikka on myöhemmin kehittynyt kielen- 
tutkimuksen suuntaus, jossa keskustelunanalyyttiset menetelmät ovat 
keskeisiä. Tilanteen mukaan samakin tutkija voi esitellä itsensä joko 
keskustelunanalyytikkona, vuorovaikutuslingvistinä tai lingvistisesti 
suuntautuneena keskustelunanalyytikkona. Keskustelunanalyyttista tut- 
kimusta tehdään ja hyödynnetään nykyisin monilla tieteenaloilla, kielen- 
tutkimuksen, sosiologian ja muiden sosiaalitieteiden lisäksi esimerkiksi 
puhetieteissä, kasvatustieteessä, antropologiassa ja neurotieteissä tutkit- 
taessa vuorovaikutuksen jäsentymistä. 
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Keskustelunanalyytikkojen ja vuorovaikutuslingvistien kiinnostuksen 
kohteena on se, millaisten käytänteiden ja toimintojen avulla sosiaalista 
vuorovaikutusta rakennetaan ja jäsennetään. Vuorovaikutuksen yksi- 
tyiskohtia tarkastelemalla pyritään ymmärtämään sellaisia osallistujien 
kompetensseja, jotka muodostavat perustan jokapäiväisille sosiaalisille 
toiminnoille (Heritage 1996 [1984], 236—239). Analyysin avulla päästään 
kiinni siihen, mikä tekee sosiaalisen vuorovaikutuksen ja osallistujien 
välisen yhteisymmärryksen mahdolliseksi. Lähtökohtana on, että tutki- 
taan autenttisia vuorovaikutustilanteita, siis sellaisia, joita ei ole järjes- 
tetty erikseen tutkimusta varten. Aineistona voivat olla puhutuista tai 
viittomakielisistä keskusteluista tehdyt ääni- ja videotallenteet tai tekno- 
logiavälitteisten puhuttujen ja kirjoitettujen keskustelujen tallenteet. 
Myös fiktiivisiä keskusteluja (esim. kaunokirjalliset dialogit, näytelmät, 
televisiosarjat) voi tutkia keskustelunanalyysin ja vuorovaikutuslingvis- 
tiikan menetelmillä. Tutkitaan sitä, miten keskustelijat osoittavat toi- 
silleen erilaisin kielellisin ja kehollisin keinoin suuntautumista siihen, 
mitä ollaan tekemässä ja millainen on heidän välinen suhteensa esimer- 
kiksi tiedollisesti tai affektisesti tapahtumahetkellä. 

Tutkimuksessa voidaan lähteä liikkeelle eri tavoin riippuen kiinnos- 
tuksen kohteesta. Tutkija saattaa olla kiinnostunut eri tavoista, joilla 
puhujat muotoilevat jonkin toiminnon, vaikka pyynnön tai pääasiaan 
palaamisen. Vaihtoehtoisesti kiinnostus voi kohdistua johonkin kielen- 
ainekseen, johon tutkija on kiinnittänyt huomiota (esim. kysymyksen 
aloittaminen and-konjunktiolla, Heritage & Sorjonen 1994; läsnä- 
olijaan viittaaminen demonstratiivilla tuo, Seppänen 1998; johonkin 
tarkoitteeseen viittaaminen demonstratiivilla tämä, Etelämäki 2006; 
-s-liitepartikkeli kysymyksissä, Raevaara 2004). Tarkasteltavana voi olla 
myös jokin kielellinen kategoria ja pohdittavana se, miten keskustelu- 
aineiston analyysi suhteutuu kielentutkimuksen aiempaan kuvaukseen 
kategoriasta (esim. alisteisista lauseista, Laury & Suzuki 2011; men- 
neen ajan aikamuodoista, Seppänen 1997a; subjektin merkinnästä, 
Helasvuo 2014; yksikön käsitteestä kielentutkimuksessa, Ono, Laury & 
Suzuki 2019; responsiivisten toimintojen yksiköistä, Helasvuo, Endo 
& Kärkkäinen 2018). Käytännössä tutkija vaihtelee analyysin fokusta 
kielenainesten ja toiminnan välillä tutkimuksen kuluessa. Metodi tarjoaa 
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vuorovaikutuksen tutkimiselle vankan empiirisen pohjan, jota voidaan 
haluttaessa täydentää muiden alojen näkemyksillä. Keskustelunanalyyt- 
tisesti päästään käsiksi vaikkapa sellaisiin ilmiöihin kuin tietäminen, 
asennoituminen, päätöksenteko, yhteisymmärryksen syntyminen ja 
erimielisyys, oppiminen, asiantuntijuus, sosiaalinen kategorisointi ja 
yhdessä liikkuminen — vuorovaikutuksen perusjäsennyksillä on osansa 
näissä kaikissa. 

Etenemme tässä artikkelissa seuraavasti: Selvitämme ensin kes- 
kustelunanalyysin ja vuorovaikutuslingvistiikan syntyä, mukaan lu- 
kien suomalainen tutkimus (luku 2), ja kuvaamme tutkimusalojen 
teoreettis-metodisia lähtökohtia (luku 3). Sen jälkeen esittelemme ja 
havainnollistamme analyysimenetelmiä (luku 4). Päätämme artikkelin 
hahmottelemalla joitakin alan ajankohtaisia kysymyksiä (luku 5). 


2. Keskustelunanalyysin ja 
vuorovaikutuslingvistiikan historiaa ja 
taustaa 


2.1. Etnometodologiasta keskustelunanalyysiin 


Keskustelunanalyysi syntyi 1960-luvun lopulla amerikkalaisessa sosio- 
logiassa Harold Garfinkelin kehittämän etnometodologian pohjalta, 
ja taustalla oli myös sosiologi Frving Goffmanin ajattelu. Garfinkel oli 
tyytymätön aikansa sosiologian tapaan nähdä sosiaalisen toiminnan ja 
yhteiskunnan järjestyneisyys tulokseksi yksilöiden sisäistämistä, ylhäältä 
annetuista normeista. Hän esitti, että ihmisten välisessä toiminnassa ja 
yhteisymmärryksen saavuttamisessa keskeisiä ovat toimijoiden jakamat 
arkipäättelyn metodit, joiden avulla he tuottavat ymmärryksen toistensa 
toiminnasta vuorovaikutuksen kuluessa (ks. Garfinkel 1967; Heritage 
1996 [1984]). Samoihin aikoihin sosiologi Erving Goffman esitti näke- 
myksiään sosiaalisten tilanteiden rakentumisesta ja yksilön suhteesta 
muihin. Hänen mukaansa näiden sosiaalisten ilmiöiden jäsentyminen 
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kasvokkaisessa vuorovaikutuksessa (engl. interaction order) on oma tut- 
kimuskohteensa (Goffman 1967, 2-3; 1983; 2012). Keskustelunanalyy- 
sin perustaja Harvey Sacks oli sekä Goffmanin että etenkin Garfinkelin 
oppilas (ks. esim. Schegloff 1992; Koskela & Piirainen-Marsh 2002; 
Maynard 2012). 

Sacks vei Garfinkelin ajattelua sosiaalisten toimijoiden jakamista 
arkipäättelyn metodeista uudelle alueelle, sosiaalisen vuorovaikutuksen 
empiiriseen analyysiin. Kimmoke tähän olivat kriisipuhelimeen soitetut 
puhelut, joihin Sacks tutustui työskennellessään itsemurhien ehkäisyyn 
keskittyneessä tutkimuslaitoksessa Los Angelesissa. Hän kiinnostui 
niistä systemaattisista ja jaetuista kulttuurisista menetelmistä, meto- 
deista, joilla keskustelijat jäsentävät vuorovaikutusta ja joilla he osoit- 
tavat suuntautumistaan toistensa toimintoihin ja niiden relevanssiin 
vuorovaikutuksen kuluessa — kieli sinänsä ei ollut Sacksin ensisijainen 
mielenkiinnon kohde. 

Sacks kehitti keskustelunanalyyttista ohjelmaa Kalifornian yliopistossa 
1964-1972 luennoissaan, jotka julkaistiin postuumisti Gail Jeffersonin 
toimittamina (Sacks 1992). 1970-luvulla julkaistiin keskustelunanalyysin 
klassiset artikkelit vuorovaikutuspuheen jäsentymisestä, sen infrastruk- 
tuurin muodostavista perusjäsennyksistä. Artikkelit käsittelivät keskus- 
telun jäsentymistä toimintakokonaisuuksiksi, puheen vuorottelua ja 
vuorovaikutuksen ongelmien käsittelyä (Schegloff & Sacks 1973; Sacks, 
Schegloff & Jefferson 2016 [1974]; Schegloff, Jefferson & Sacks 1977).? 


Keskustelun perusjäsennykset 


Alkuvaiheistaan lähtien keskustelunanalyysi on pyrkinyt osoittamaan, 
millaisten perustavien jäsennyskeinojen varaan puhuttu vuorovaikutus 
rakentuu. Vuorottelujäsennys kuvaa mekanismeja, joilla osallistujat jär- 
jestävät puheenvuorojen ottamisen ja vaihtumisen (Sacks, Schegloff & 
Jefferson 2016 [1974]). Sekvenssijäsennys kattaa toimintajaksojen perus- 
rakenteet, joilla puhujien vuorot suhteutuvat toisiinsa ja muodostavat 
koherentteja sosiaalisen toiminnan kokonaisuuksia (ks. Schegloff 2007; 
Haakana 2008; Raevaara 2016). Korjausjäsennyksen avulla osallistujat kä- 
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sittelevät puhumisen, kuulemisen ja ymmärtämisen ongelmia (ks. Sor- 
jonen 1997; Hayashi, Raymond & Sidnell 2013; Haakana, Kurhila, Lilja & 
Savijärvi 2016). Vuorovaikutuksen jäsentymisen perusilmiöihin kuuluvat 
myös vastaanottajan huomioiva muotoilu (engl. recipient design, Sacks, 
Schegloff & Jefferson 2016 [1974]: 50) eli se, miten puhuja muotoilee 
vuoronsa tilanteeseen ja tietylle vastaanottajalle sopivaksi, sekä osallis- 
tumisen ja yhteistoiminnan kehollinen koordinointi (Seppänen 1997c; 
C. Goodwin & M. H. Goodwin 2004; C. Goodwin 2017). 


Sacksin menehdyttyä auto-onnettomuudessa vuonna 1975 keskustelun- 
analyysin kehittämistä jatkoivat keskeisesti Emanuel Schegloff ja Gail 
Jefferson. Keskustelunanalyysin tuntemusta ja asemaa kielentutkimuk- 
sessa vahvisti Stephen C. Levinsonin (1983) oppikirja Pragmatics, jonka 
keskustelunanalyysia käsittelevässä laajassa luvussa Levinson tekee eron 
kirjoittamisajan diskurssianalyysin? ja keskustelunanalyysin välille ja 
osoittaa keskustelunanalyysin kontribuoivan tärkeällä tavalla ymmärryk- 
seen lausuman merkityksestä (esim. epäsuorat puheaktit, Gricen mak- 
siimit, presuppositio, deiksis; ks. Levinson 1983, luku 8). Sittemmin kes- 
kustelunanalyysista on tullut keskeinen vuorovaikutuksen empiirisen 
tutkimuksen suuntaus useilla tieteenaloilla (ks. Sidnell & Stivers 2012). 

Suomeen keskustelunanalyysin toivat 1980-luvulla kielentutkijat, 
Auli Hakulinen ja hänen tutkimusryhmänsä.t Hakulinen oli kiinnos- 
tunut arkipuheen syntaksista, ja sen tutkimiseksi haettiin menetelmiä, 
joilla tutkia puhuttua vuorovaikutusta. Konkreettinen metodinen ponnin 
oli Ruotsissa 1987 järjestetty pohjoismainen kesäkoulu, jonka opetta- 
jiin kuuluivat Schegloff, John Heritage ja Adam Kendon. Sen tuloksena 
alkoi suhteiden solmiminen keskustelunanalyysin keskeisiin tutkijoi- 
hin, joista monet ovat vierailleet kouluttajina Suomessa (ensimmäisinä 
Gail Jefferson”, Paul Drew sekä Charles ja Marjorie Harness Goodwin). 
Vuonna 1989 ilmestyi tutkimusryhmän kokoomateos Suomalaisen kes- 
kustelun keinoja (Hakulinen 1989), joka sisältää Hakulisen kirjoittaman 
laajan jakson keskustelunanalyysin soveltuvuudesta keskustelupuheen 
tutkimusmenetelmäksi sekä moniulotteisen kirjoituksen keskustelun 
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tutkimuksen tavoitteista ja puheen syntaksin ja perinteisen kieliopin 
tutkimuksen suhteista (luvut 1-2).° Teos sisältää kirjoituksia modaali- 
verbeistä, henkilöviittauksista, puheenvuoroa aloittavista aineksista ja 
myös menetelmällisistä kysymyksistä. 1980-luvun lopulla keskustelun- 
analyyttista tutkimusta tekivät ja hyödynsivät fennistien lisäksi myös 
logopedit, sosiolingvistit ja suomenruotsin tutkijat. 1990-luvun alkupuo- 
lella sai alkunsa ensimmäinen sosiaalitieteilijöiden ja kielentutkijoiden 
yhteishanke vuorovaikutuksesta lääkärin vastaanotolla (ks. Hakulinen 
& Sorjonen 1993). 2000-luvun alkuun tultaessa keskustelunanalyyttista 
tutkimusta tekeviä tutkijoita oli lähes kaikissa maamme yliopistoissa ja 
useilla tieteenaloilla. 


2.2. Keskustelunanalyysista vuorovaikutuslingvistiikkaan 


Termin vuorovaikutuslingvistiikka (engl. interactional linguistics) lanseera- 
sivat 2000-luvun alussa Saksassa toimineet kielentutkijat kattotermiksi 
tutkimukselle, joka selvitti keskustelupuheen fonologiaa, kieliopin ja 
vuorovaikutuksen suhdetta, kielen kontekstualisointia ja keskustelu- 
puheen prosodiaa (Couper-Kuhlen & Selting 2001, 1-22). Suuntauk- 
sen lähtölaukauksena toimi kaksi perättäistä Eurokonferenssia (Euro- 
Conference; Spa 2000, Linguistic Organization of Conversational 
Activities ja Helsinki 2002, Linguistic Structures and their Deployment 
in the Organisation of Conversation). 

Vuorovaikutuslingvistiikan synnyn taustalla oli kolme toisistaan 
erillistä tutkijaverkostoa: Isossa-Britanniassa keskustelupuheen fone- 
tiikkaan keskittyneet tutkijat, Saksassa keskustelupuheen syntaksiin ja 
prosodiaan keskittyneet tutkijat sekä Yhdysvalloissa (diskurssi)funktio- 
naalisen syntaksin sekä kieliopin ja vuorovaikutuksen tutkijat (Couper- 
Kuhlen & Selting 2017, 4-14; myös Clift 2016, 26—27). Kieliopin ja 
vuorovaikutuksen tutkijoiden moninainen tausta näkyi kokoomateok- 
sessa Interaction and grammar (1996). Sen toimittajat Elinor Ochs, 
Emanuel Schegloff ja Sandra Thompson toimivat kolmella tieteenalalla, 
lingvistisessä antropologiassa, sosiologiassa ja funktionaalisessa kieli- 
tieteessä. He toteavat teoksen johdannossa, että kielioppia lähestytään 
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teoksessa osana laajempaa vuorovaikutusresurssien joukkoa. Kielioppi 
nähdään yhtenä resurssina käytänteissä, jotka muodostavat perustan 
sosiaaliselle elämälle (esim. toiminnan, tiedon ja tunteiden ilmaisun 
jäsentymiselle) ja erityisesti sille, miten kieli on mukana arjen vuoro- 
vaikutuksessa (Schegloff, Ochs & Thompson 1996). 

Couper-Kuhlen ja Selting (2017, 16) kiteyttävät kolme vuorovaikutus- 
lingvistiikan yleistä tavoitetta. Tavoitteena on 1) tarjota funktionaalinen 
kuvaus kielellisistä rakenteista resursseina, joilla hoidetaan toistuvia teh- 
täviä sosiaalisessa vuorovaikutuksessa, 2) analysoida ja verrata eri kiel- 
ten käytänteitä, jotta saadaan selville, kuinka kielen rakenne vaikuttaa 
sosiaalisen vuorovaikutuksen yksityiskohtiin ja kuinka vuorovaikutuk- 
sen vaatimukset muokkaavat kielen rakennetta ja käyttöä ja 3) rakentaa 
sellaista teoriaa, joka selittää, miten kieli on jäsentynyt ja miten sitä käy- 
tetään sosiaalisessa vuorovaikutuksessa. 

Vuorovaikutuslingvistisen tutkimuksen metodinen kirjo on laaja esi- 
merkiksi sen suhteen, mikä osuus on vuorovaikutuksen ja kielen toi- 
mintoluonnetta korostavilla keskustelunanalyyttisilla metodeilla, mikä 
kielen kategorioihin keskittyvällä perinteisemmin lingvistisellä tutki- 
muksella. Vastaavasti laadullisten ja määrällisten menetelmien käyttä- 
minen vaihtelee. Vuorovaikutuslingvistiikan synnyn myötä suomalaiset 
tutkijat ovat asemoineet tutkimuksensa metodisesti joko vuorovaikutus- 
lingvistiseksi tai keskustelunanalyyttiseksi tai molempiin suuntauksiin 
kuuluvaksi (esim. Etelämäki 2006, 12; Korpela 2007, 15; Helasvuo 
2008; Koivisto 2011, 13-16; Niemi 2015, 7-8; Heinonen 2017, 11-12). 


2.3. Keskustelunanalyysista multimodaaliseen 
keskustelunanalyysiin 


Mitä enemmän videotallenteiden käyttö on yleistynyt keskustelun- 
analyyttisessä tutkimuksessa, sitä enemmän tutkijat ovat alkaneet suun- 
tautua vuorovaikutuksen kokonaisvaltaisempaan tarkasteluun ottamalla 
huomioon vuorovaikutuksen resurssit entistä laajemmin: esimerkik- 
si puheen foneettis-prosodiset piirteet, erilaiset kehollisen sosiaalisen 
toiminnan muodot sekä fyysisen tilan ja sen materiaalisen luonteen. 


LUKU 22 KESKUSTELUNANALYYSI JA VUOROVAIKUTUSLINGVISTIIKKA 903 


Multimodaalisen keskustelunanalyysin uranuurtajia ovat olleet amerik- 
kalaiset antropologit Charles Goodwin (1979; 1981; 2017) ja Marjorie 
Harness Goodwin (1980; M. H. Goodwin & Cekaite 2018) sekä britti- 
sosiologi Christian Heath (1986), jotka aloittivat vuorovaikutustilantei- 
den kuvaamisen tutkimusaineistoksi. Charles Goodwin on rakentanut 
systemaattisesti holistisempaa tutkimusta alkaen katseen, eleiden, ruu- 
miinasennon ja tilankäytön tutkimuksesta ulottuen aina siihen, miten 
materiaalinen ympäristö esiintyy vuorovaikutuksessa. Hänen varhainen 
artikkelinsa (1979) lauseen rakentamisesta suhteessa katseella osoitet- 
tuihin osallistumiskehikon muutoksiin on ollut vaikutusvaltainen myös 
vuorovaikutusta kielitieteellisestä näkökulmasta käsittelevässä tutkimuk- 
sessa. Erilaisen kehollisen (engl. embodied) toiminnan tutkimus on laa- 
jentunut 1990-luvulta alkaen niin, että 2000-luvun tilannetta on kuvattu 
tutkimuksen multimodaalisen käänteen ajaksi keskustelunanalyysissa 
(Nevile 2015; Mondada 2016). 

Suomalaiseen keskustelunanalyyttiseen ja vuorovaikutuslingvistiseen 
tutkimukseen kehollisen toiminnan ja myös erilaisten materiaalien käy- 
tön tarkastelun toivat jo varhain logopedit, jotka analysoivat keskustelu- 
ja, joissa oli afaattinen puhuja (Klippi 1996; Laakso 1997). Viime aikoina 
on tutkittu esimerkiksi opettajajohtoisen luokkahuonevuorovaikutuksen 
multimodaalisuutta (Kääntä 2015) ja oppilaiden välisiä kosketuksia (Kar- 
vonen, Heinonen & Tainio 2018), kielen ja kehollisen toiminnan yhdis- 
telmiä tarjouksen muotoilussa (Kärkkäinen & Keisanen 2012), monitoi- 
mintaa (engl. multiactivity, Haddington, Keisanen, Mondada & Nevile 
2014) sekä kirjoittamista erilaisissa vuorovaikutustilanteissa (Mondada 
& Svinhufvud 2016). On tutkittu myös vuorovaikutusta erilaisissa ym- 
päristöissä liikuttaessa, kuten autolla ajaessa ja metsässä (Haddington 
& Rauniomaa 2011; Keisanen, Rauniomaa & Siitonen 2017; Siitonen, 
Rauniomaa & Keisanen 2019). Multimodaalista tutkimusta erilaisista 
kauppa-asioinneista (kioskilla, leipomossa, juustokaupassa) on tehty ja 
tekeillä niin Suomessa kuin monissa muissa Euroopan maissa (esim. 
Harjunpää, Mondada & Svinhufvud 2018; Lappalainen & Raevaara 
2009; Sorjonen & Raevaara 2014; Svinhufvud 2018). 

Kieliopin tutkimuksen alueella Eeva-Leena Seppänen (1998) näyt- 
ti katseen analyysin tuella, että läsnä olevaan henkilöön viittaavat 
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demonstratiivipronominit tämä ja tuo ovat keino osoittaa läsnäolijoiden 
puhujastatuksia eikä niinkään heidän spatiaalisia suhteitaan. Viime- 
aikaisessa tutkimuksessa taas on muun muassa käynyt ilmi, että lau- 
seen ja lausekkeen vaihtelu keinona pyytää myyjältä tuotetta kioskilla 
on ikonisessa suhteessa siihen, kuinka kaukana asiakas on suhteellisesti 
tiskistä ja kuinka kauan häneltä kestää saapua tiskille — kielellistä keinoa 
muokataan joustavasti meneillään olevaan keholliseen ja sekventiaali- 
seen toimintaan (Sorjonen & Raevaara 2014). Chiara Monzoni ja Ritva 
Laury (2015) puolestaan osoittavat, kuinka referenttiä, jota ei ole aiem- 
min mainittu, arvioidaan ilman mainintaa luomalla pääsy siihen multi- 
modaalisesti. Parhaillaan on käynnissä keskustelu siitä, voidaanko ke- 
hollista toimintaa pitää osana kielioppia tietyissä tapauksissa (Keevallik 
2018; Couper-Kuhlen 2018; Streeck 2018). 

Vuorovaikutuspuheen foneettinen tutkimus keskustelunanalyytti- 
sesta näkökulmasta alkoi Isossa-Britanniassa 1980-luvun alkupuolella, 
jolloin John Local ja Peter French tutkivat muun muassa vuorosta kilpai- 
lun fonetiikkaa (French & Local 1983), ja siitä alkaen vuorovaikutuksen 
foneettinen tutkimus on jatkunut vahvana (esim. Ogden 2013). Vuoro- 
vaikutuksen prosodinen tutkimus sen sijaan sai vahvemmin alkunsa 
Saksassa (Couper-Kuhlen & Selting 1996; Couper-Kuhlen & Ford 2004). 
Suomen kielen fonetiikkaa ja prosodiaa on selvittänyt muun muassa 
Richard Ogden (2001), joka on tutkinut narinan ja glottaaliklusiilin 
yhteyttä puheenvuoron vaihtamiseen ja sen pitämiseen. Ogden, Auli 
Hakulinen ja Liisa Tainio (2004) ovat analysoineet prosodista tyylitte- 
lyä, jota käytetään vähättelemään sanotun uutisarvoa, ja Ogden ja Sara 
Routarinne (2005) nousevan intonaation tehtäviä suomessa. 


2.4. Kielikäsitys 


Keskustelunanalyysi ei ole varsinaisesti kieltä koskeva teoria, vuoro- 
vaikutuslingvistiikka sen sijaan keskittyy nimenomaisesti kieleen. Kes- 
kustelunanalyysin pääasiallinen kiinnostuksen kohde on sosiaalisen 
toiminnan jäsentyminen ajallisessa ja sekventiaalisessa kontekstissaan. 
Suuntaus sisältää kuitenkin kielentutkimukselle relevantteja oletuksia. 
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Yksi niistä on Garfinkelin (1967) esittämä ajatus kaikkien kielellisten 
ilmausten indeksisyydestä. Se laajentaa perinteistä filosofista ja ling- 
vististä näkökulmaa indeksisyyteen: indeksisyys koskee kaikkea vuoro- 
vaikutuspuhetta ja kielellistä toimintaa, niin että kaikkien ilmausten 
tulkitseminen vaatii kontekstin huomioon ottamista (Garfinkel 1967). 
Keskustelunanalyyttisessa tutkimuksessa tämä liittyy siihen, että lausu- 
man ja vuoron tulkinnassa olennaista on sekä vuoron muotoilu että sen 
käyttökonteksti, kuten kielellisen tuotoksen paikka meneillään olevassa 
vuorossa ja laajemmassa toiminnassa. Usein annettu esimerkki on ky- 
symyslause ja sen tehtävät vuorovaikutuksessa. Esimerkiksi englannin 
kysymyslause why don’t you lay down and take a nap voi käyttökonteks- 
tissaan toimia kysymyksen sijasta pikemminkin ehdotuksena lopettaa 
puhelu (Schegloff & Sacks 1973; Thompson & Couper-Kuhlen tulossa). 
Kysymyslauseen otatko kahvia monitehtäväisyys käy puolestaan ilmi vas- 
tauksesta kyllä kiitos, jolla puhuja vastaa niin lausuman muotoon vaihto- 
ehtokysymyksenä (kyllä) kuin sen funktioon tarjouksena (ks. Schegloff 
2007, 75-76; myös Schegloff 1984). 

Vuorovaikutusta tarkastellaan dynaamisesti ajassa muotoutuvana 
toimintana, jossa kielelliset rakenteet näyttäytyvät sekventiaaliseen kon- 
tekstiinsa sovitettuina käytänteinä. Tutkimuksessa on tässä yhteydessä 
käytetty käsitettä paikkasensitiivinen kielioppi (engl. positionally sensitive 
grammar, Schegloff 1996). Käsitteellä viitataan siihen, miten kielellisten 
rakenteiden käyttö ja tulkinta kytkeytyvät vuorovaikutuksen ajalliseen 
ja sekventiaaliseen etenemiseen. Esimerkiksi partikkelin kyllä funktio 
varioi sen mukaan, onko partikkeli lausuman alussa, keskivaiheilla vai 
lopussa (Hakulinen 20013). Englannissa puolestaan tarkennusta hake- 
van kysymyksen (kuten When's the next elections) jälkeen lausekevastaus 
(Two thousand four) on tunnusmerkitön eli ongelmattomana käsitelty ja 
frekvenssiltään yleinen, kun taas kerrontaa hakevan kysymyksen (How 
you guys know each other) jälkeistä lausekevastausta (Pam, nimeten yh- 
teisen tuttavan) käsitellään ongelmallisena (Thompson, Fox & Couper- 
Kuhlen 2015, 23—25, 42—44). Sama vastaustyyppi toimii siis eri tavoin 
riippuen kysymyksen funktiosta (kysymyksistä ja vastauksista suomessa 
ks. Sorjonen 2001a; 2001b; Hakulinen 2001b; Vepsäläinen 2019). Mo- 
net keskustelunanalyyttiset tutkimukset ovatkin tarkastelleet kielellisten 
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rakenteiden käyttöä tietyssä sekventiaalisessa asemassa, kuten Niemi 
(2010) tutkimuksessaan verbialkuisen lauserakenteen käytöstä kahden 
puhujan välisessä myönnyttelevässä toimintajaksossa ja tutkimukses- 
saan (2013) neljän muodoltaan läheisen rakenteen käytöstä vastaamas- 
sa toteamukseen tai vaihtoehtokysymykseen (myös Couper-Kuhlen 
& Thompson 2000; muunlaisista tapauksista ks. esim. Curl & Drew 
2008; Hakulinen & Sorjonen 2009; Sorjonen & Hakulinen 2009; 
Koivisto 2017). 

Kielellisten ilmaisujen kontekstisidonnaisuuteen eli indeksisyyteen 
punoutuu refleksiivisyys, jonka Garfinkel ja Sacks (1970) esittävät vuoro- 
vaikutustoimintojen olennaisena piirteenä. Tuottamallaan vuorolla pu- 
huja osoittaa tulkintansa siitä, millainen toiminta on meneillään, ja 
samanaikaisesti vuorolla on seurauksia vuorovaikutuksen etenemiselle — 
puheenvuoro synnyttää konteksin, jossa se itse esiintyy. Heritage (1996 
[1984], 237) kiteyttää tämän sosiaalisten toimintojen ja puheenvuorojen 
kaksoiskontekstuaalisuudeksi: jokainen toiminto on kontekstin muo- 
vaama ja kontekstia uudistava. Näin ollen mitään vuorovaikutuksen yk- 
sityiskohtaa ei keskustelunanalyyttisessa tarkastelussa voida sivuuttaa 
apriorisesti sattumanvaraisena tai merkityksettömänä. 

Vuorovaikutuslingvistiikka jakaa monia keskustelunanalyyttisia käsi- 
tyksiä. Niinpä katsotaan, että osallistujat aktiivisesti synnyttävät vuoro- 
vaikutuksen reaaliajassa sen, mitä pidetään kielellisinä yksikköinä, 
kuten lausekkeen tai lauseen. Yksiköt muotoutuvat vuorovaikutuksen 
edetessä, ja niiden muotoutumiseen vaikuttavat erilaiset puheen ajalliset 
ominaisuudet ja rajoitteet, kuten sen ohimenevyys, peruuttamattomuus 
sekä puhumisen ja puheen vastaanottamisen välinen synkronisaatio 
(Auer 2009). Kielellinen yksikkö voidaan tuottaa myös yhteistyössä niin, 
että se jakautuu useammalle puhujalle (esim. Hayashi 2003; Helasvuo 
2004). Prosessia, jossa sekä yksittäinen, hetkellinen kielellinen tuotos 
että pysyvämmäksi kiteytyvä kielioppi syntyvät ja muovautuvat kielen 
käytön myötä, kutsutaan emergenssiksi (ks. Hopper 1987; 2011; Helas- 
vuo 2009; Pekarek Doehler 2011; myös Lindström 2006). Kielellisten 
käytänteiden emergenssi ja kielenkäytön konteksti, etenkin sen sekven- 
tiaalinen konteksti, kuuluvat olennaisesti vuorovaikutuslingvistiseen 
teoriaan. (Ks. tarkemmin Couper-Kuhlen & Selting 2017.) 
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Keskeinen vuorovaikutuksen ja kieliopin hetkessä muotoutuva omi- 
naisuus on projektio eli se, millaisia odotuksia ja rajoitteita jonkin ele- 
mentin tuottaminen asettaa vuoron ja toiminnan etenemiselle (ks. Auer 
2005; Auer & Pfänder 2011; Couper-Kuhlen & Selting 2017). Nämä olo- 
suhteet koskevat sekä vuoron tuottajaa että vastaanottajaa. Kielellisten 
rakenteiden ja toiminnan projektio mahdollistaa muun muassa sen, 
että keskustelun osallistujat voivat tulkita ja tunnistaa toimintoja jo var- 
haisessa vaiheessa toisen vuoroa, mikä taas mahdollistaa saumattoman 
vuoronvaihdon ja yleisesti keskustelun jouhevan etenemisen.$ Näin 
ollen kielellisiä rakenteitakaan ei analysoida vain puhuessa syntyneen 
lopputuloksen eli jonkin tuotetun ilmauksen näkökulmasta vaan ottaen 
huomioon myös niiden ajallisen ja vuorovaikutuksellisen syntyprosessin 
(vrt. Kieliopin tutkimus ja kielioppiteoriat, luku 3.6. tässä kirjassa). 


2.5. Eettisiä kysymyksiä 


Keskustelunanalyyttinen tutkimus perustuu tyypillisesti aitojen, ilman 
koejärjestelyjä tuotettujen keskustelutilanteiden tarkkaan analyysiin. 
Tarkasteltavien tilanteiden kirjo on laaja aina perheenjäsenten ja ystä- 
vien välisistä arkisista keskusteluista institutionaalisiin ja ammatillisiin 
tilanteisiin. Aineisto on tallennettava, jotta sitä voidaan luotettavasti 
analysoida. 

Tutkimuksessa kannattaa suosia sellaista aineistoa, jossa tutkija itse 
tai tämän läheiset eivät ole mukana, jotta suhteiden läheisyys ei hämärrä 
analyysia. Kaikissa tapauksissa jokaiselta tilanteen osanottajalta tarvitaan 
etukäteen lupa vuorovaikutustilanteen taltiointiin, käsittelyyn ja arkis- 
tointiin. Vaikka tutkimuksessa esiinnytään nimettömästi, ääni ja kuva 
ovat tunnistetietoja, joten aineiston säilyttäminen ja käsittely on järjes- 
tettävä niin, että tutkittavien tietosuoja taataan annetun suostumuksen 
mukaisesti. Tähän sisältyy muun muassa tunnistetietojen muuttaminen 
litteraatioissa. EU:n uusi tietosuoja-asetus astui voimaan toukokuussa 
2018, ja uusia kansallisia käytänteitä ja ohjeistuksia on laadittu. Tutki- 
muslupiin sisällytettävistä seikoista, lupien muotoilusta ja tutkittavien 
informointitavasta, aineiston käsittelystä ja turvallisesta säilyttämisestä 
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saa tietoa yliopistojen tietosuojavastaavilta, tekniseltä henkilökunnalta ja 
kokeneilta aineistonkerääjiltä. 

Arkistoidut vuorovaikutusaineistot mahdollistavat erilaisia tutkimus- 
näkökulmia, mukaan lukien historiallisen tutkimuksen ja monenlai- 
sen kieltä koskevan tutkimustiedon soveltamisen, jota yhteiskunnassa 
tarvitaan ja johon kielentutkijoilla on metodisia valmiuksia. Tutkimus- 
aineistojen asianmukainen säilyttäminen ja saatavuus onkin ensiarvoi- 
sen tärkeää. 


3. Tutkimisen käytänteitä ja kohteita 
3.1. Tutkimusprosessin eteneminen 


Tutkimus lähtee liikkeelle joko tarkasteltavan kielellisen rakenteen tai toi- 
minnon taikka vuorovaikutustilanteen valitsemisesta ja aineiston hank- 
kimisesta. Aineiston valinnassa voi painottua tietty toimintaympäristö 
(työyhteisö, luokkahuone, perheen aamiaishetket), tai sitten voidaan 
tarkastella jotakin vuorovaikutuksen ilmiötä tai kielellistä rakennetta 
erilaisten tilanteiden kautta ja pyrkiä yleistyksiin sen tehtävistä. Arki- 
keskusteluja pidetään lähtökohtaisena aineistona, koska ne ovat monessa 
mielessä ensisijainen kielenkäytön konteksti (Drew & Heritage 1992; 
Raevaara, Ruusuvuori & Haakana 2001; Heritage & Clayman 2010). 
Tarpeen mukaan voidaan joko käyttää valmiiksi saatavilla olevia ai- 
neistoja tai kerätä uusia. Aiemmin koottua puhutun vuorovaikutuksen 
aineistoa on tarjolla yliopistojen arkistoissa (esim. Helsingin yliopiston 
Keskusteluntutkimuksen arkisto). Arkikeskustelujen morfosyntaktinen 
tietokanta Arkisyn on julkisesti käytettävissä Kielipankissa (tietokanta 
on laadittu Turun yliopiston suomen kielen oppiaineen hankkeessa, 
ja perusaineisto on Helsingin ja Turun yliopistoista). Kun hankitaan 
uutta aineistoa, se tallennetaan hyvätasoisin video- ja äänitallentimin. 
Kameran kuvakulman on tärkeä kattaa sekä yksityiskohdat että ympä- 
röivä tilanne mahdollisimman laajasti, ja usein tarvitaankin useampi 
kamera (esim. tutkittaessa luokkahuonevuorovaikutusta) — kasvokkaisen 
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vuorovaikutuksen tutkimukseen taltiointi, jossa kameran kuvakulmassa 
on vain yksi henkilö, on käytännössä käyttökelvoton. Tutkijan kannat- 
taakin tutustua kuvauspaikan puitteisiin ja suunnitella kuvakulmia 
ennakkoon. Sopivien tallennusvälineiden ja -formaattien sekä ku- 
vauskulmien valitsemiseksi voi hakea neuvoa asiantuntijoilta. Ennen 
vuorovaikutuksen tallentamista on hyvä tehdä ainakin jonkin verran 
etnografista kenttätyötä kuvattavien ja kuvauspaikan toimintojen ym- 
märtämiseksi, merkiten muistiin tallennustilannetta koskevia seikkoja. 
(Systemaattisen johdatuksen keskustelunanalyyttisen tutkimuksen ai- 
neiston keräämisen eri puoliin esittää Mondada 2012a.) 

Aineistonkeruun jälkeen aineisto käsitellään muun muassa nimeä- 
mällä tiedostot systemaattisesti ja tekemällä varmuuskopiot sekä kir- 
jaamalla metatietoja (aika ja paikka, kesto, osanottajien kuvaus jne.). 
Aineistoon tutustumisen voi aloittaa kuuntelemalla tai katsomalla tal- 
lenne kokonaisuudessaan ja merkitsemällä muistiin havaintoja. Näin 
aineiston kokonaisuuteen saa jo alustavan näkökulman. Tämän jälkeen 
voi ruveta litteroimaan oman kiinnostuksen kohteena olevia kohtia. 
Puheen litterointiin voidaan käyttää erityisiä ohjelmia, kuten ELAN ja 
Transana. Litterointitapa ja tarkkuusaste valitaan tutkimuksen tarkoituk- 
sen mukaan, ja jokainen litterointitapa on väistämättä valikoiva. Usein 
alun karkeaa litteraatiota tarkennetaan vasta, kun on päätetty tarkem- 
man analyysin kohteet. 

Keskustelunanalyyttisen tutkimuksen tarpeisiin on kehitetty oma 
litterointitapansa (liite 1), joka kuvaa puheen etenemistä ja tuottamista 
osanottajien välisen vuorovaikutuksen näkökulmasta; litterointitavan 
loi alkuaan Gail Jefferson (ks. Seppänen 1997b; Sorjonen & Raevaara 
2006; Hepburn & Bolden 2012). Saksalaiset vuorovaikutuslingvistit ja 
keskustelunanalyytikot ovat laajentaneet jeffersonilaista litterointitapaa 
kielellisten ja foneettisten seikkojen, erityisesti prosodian esittämiseksi 
(Selting ja muut 2011). Jotkut tutkijat käyttävät tarkemman foneettisen 
esittämisen tarpeisiin myös kansainvälistä foneettista aakkostoa (IPA, 
International Phonetic Alphabet)? tai suomalais-ugrilaista tarkekirjoitusta 
(SUT, ks. Sovijärvi & Peltola 1977). Foneettisen analyysin tarpeisiin käy- 
tetään Praat-ohjelmaa.'* Multimodaalista litterointitapaa (liite 2) on kehit- 
tänyt erityisesti Lorenza Mondada, jonka litterointisysteemiä käytetään 
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yhä laajemmin keskustelunanalyyttisessa tutkimuksessa (Mondada 2016; 
2018; Harjunpää, Mondada & Svinhufvud 2019). Aineiston esittämista- 
pojen ja itse analyysin yksityiskohtaisuus liittyy pyrkimykseen rajata ja 
jäsentää tutkittava ilmiö vuorovaikutuksen osallistujien ja heidän havaitun 
toimintansa ehdoilla huomioiden, että mikä tahansa vuorovaikutuksen 
elementti voi osoittautua analysoitavan ilmiön kannalta merkitykselliseksi. 

Vuorovaikutuksen analyysi sisältää erilaisia vaiheita (ks. esim. Sidnell 
20093; 2009b; 2012; Vatanen 2016). Analyysi voi lähteä liikkeelle josta- 
kin havainnosta, jonka tutkija tekee aineistoa kuunnellessaan ja katsoes- 
saan. Havainnon laajentamiseksi ja havaitun ilmiön kuvaamiseksi muo- 
dostetaan esimerkkikokoelmia (engl. collection). Aluksi kerätään kaikki 
tiettyä käytännettä koskevat tapaukset, esimerkiksi kohdat, joissa puhuja 
ei jatkakaan puheenvuoroaan konjunktiona käytettävän sanan jälkeen 
(esim. ja, mutta, että) ja vastaanottaja ottaa vuoroon (ks. Koivisto 2011). 
Kun tapaukset on kerätty, niitä ruvetaan tarkastelemaan yksityiskohtai- 
semmin ja vertailemaan keskenään: onko kaikilla jotakin yhteistä vai 
onko kyseessä useampi vuorovaikutusilmiö, jotka voidaan jakaa omiksi 
kokoelmikseen. Vaihtelemalla työtapaa yksittäisten tapausten analyysista 
kokoelmien tarkasteluun ja takaisin päästään lopulta yleisempään il- 
miön kuvaukseen ja yleistyksiin. 

Analyysissa etsitään näyttöä vuorovaikutuksen osallistujien omasta 
suuntautumisesta havaittuihin käytänteisiin: tarkastellaan muun muas- 
sa vuoron suhdetta aiempiin vuoroihin, vuoron muotoilua kokonaisuu- 
tena, vaihtoehtoisia muotoiluja eri tapauksissa ja sitä, miten vuoroon 
vastataan. Havaitusta ilmiöstä näennäisesti poikkeavia tapauksia (engl. 
deviant case) voidaan käyttää havaintojen vahvistamiseen osoittamalla 
osallistujien itsensä suuntautuminen taustalla olevaan käytänteeseen 
tai muu tilanteinen poikkeamaa selittävä seikka — muussa tapauksessa 
joudutaan tarkentamaan itse ilmiön kuvausta (ks. ten Have 2007, 151). 
Esimerkiksi vierusparin osien eli etu- ja jälkijäsenen (kuten kysymys 
ja vastaus) kiinteä suhde on osoitettu sillä, että osallistujat selittävät tai 
paikkaavat jälkijäsenen puuttumista toiminnallaan. Jotkut tutkijat kvan- 
tifioivat löydöksiään, toiset taas pitäytyvät laadullisessa tutkimuksessa, 
joka voi koskea jopa vain yksittäistä tapausta (esim. C. Goodwin 1979; 
Whalen, Zimmerman & Whalen 1988). Tapausten laadullinen vertailu 
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kuuluu kuitenkin yleensä keskeisesti tutkimusprosessiin (Haakana, 
Laakso & Lindström 2009). 

Kokoelmien ja vertailun merkitys sekä aineistolähtöisyys näkyvät 
muissakin tutkimuksen vaiheissa. Keskustelunanalyytikot käyttävät 
havaintojen muodostamiseen ja testaamiseen yhteisöllistä analyysin 
muotoa, datasessioita (ks. Peräkylä 1997; Stevanovic & Weiste 2017). 
Datasessiossa osanottajat tarkastelevat aineistoa yhdessä ja keskustelevat 
havainnoistaan metodiseen asiantuntemukseensa, aiempaan tutkimuk- 
seen ja osin myös intuitioonsa nojaten. Kollektiivinen kriittinen tarkaste- 
lu vahvistaa havaintojen ja analyysien luotettavuutta. Saman periaatteen 
mukaisesti myös tutkimusten julkaisuissa näytetään kattavasti aineisto- 
esimerkkejä, joiden perusteella lukija voi arvioida esitettyjä tuloksia. 


3.2. Rakenteet, resurssit ja toiminta 


Kaikessa tutkimuksessa otetaan huomioon keskustelun jäsennyskeinot: 
vuorottelu ja vuoron rakenneyksiköt, sekvenssien rakentuminen ja se, 
miten kohdetoimintoon vastataan ja miten se tulkitaan, sekä puheen 
etenemisen katkokset ja korjaukset. Ne eivät perustu kasvokkaisissa ti- 
lanteissa vain kielellisten vaan myös kehollisten resurssien käyttöön. 
Siksi keskustelunanalyyttisessa tutkimuksessa käytetäänkin yhä enem- 
män videoaineistoja. 

Tässä jaksossa havainnollistamme kahden videoidun ja litteroidun 
keskustelukatkelman avulla keskustelunanalyyttista ja vuorovaikutus- 
lingvististä tutkimusotetta. Tarkoituksemme on näyttää esimerkkien 
avulla, mihin analyysissa saatettaisiin kiinnittää huomiota ja millai- 
siin kysymyksiin se voisi tarjota vastauksia. Kumpikin esimerkki on 
institutionaalisesta, vähintään toisen osapuolen työtehtäviin liittyvästä 
tilanteesta, jossa vuorovaikutuksella on jokin institutionaalinen pää- 
määrä (institutionaalisen vuorovaikutuksen tutkimuksesta ks. Drew 
& Heritage 1992; Ruusuvuori, Haakana & Raevaara 2001; Heritage & 
Clayman 2010). Ensimmäinen esimerkkimme on kasvokkainen asioin- 
titilanne kioskista ja toinen kahden yrityksen välillä puhelimitse käyty 
etämyyntineuvottelu, jossa käytetään jaettua tietokoneruutua. 
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Kaksi tapausta. Ensimmäisessä katkelmassa asiakas tulee kioskille 
ostamaan päivän lehteä, jonka etusivulla on juttu Suomen euroviisu- 
edustajan heikosta menestyksestä. Katkelma osoittaa kielellisten ja ke- 
hollisten resurssien hienovaraisen yhteispelin sinänsä yksinkertaisessa 
vuorovaikutustapahtumassa. Havainnollistamme katkelman tarkastelus- 
sa sitä, miten asiakkaan pyytämä lehti tulee myyjän ja asiakkaan jaetun 
huomion kohteeksi kielellisesti ja kehollisesti, muun muassa sen kautta, 
miten demonstratiiviset paikanilmaukset suhteutuvat toiminnan etene- 
miseen. Käytetyt litterointimerkit ovat artikkelin lopussa liitteenä. 


Esimerkki 1. Iltalehti (t228 00:15-00:32) 
MYY=myyjä, ASI=asiakas 


01 ASI: ööh (.) ilta+lehti >ei kai se< teill ole 
asi +katsoo ympärilleen--> 
02 [1 o p]pun’t°. 
03 MYY: [joo,h] 
04 (0.2)+(0.4) +(0.1) 
asi ->+kats. lompakkoaan+kohottaa katsettaan-> 
05 ASI: eihän+ teill ole #loppu#nu. 
asi ->+katsoo lompakkoaan-> 
06 (0.8) 
07 MYY: e:i; ota< (.) >iltalehev vai il+ttat< 
asi ->+katsoo alas laukkuaan-> 
08 ASI: il[ ta * 1 e]*hti. 
09 MYY: [>sanomat<.] 
myy Kount *lukee viivakoodin-> 
10 MYY: [jaha; 
11 ASI: [(joo.) 


12 (1.3)* 
myy ->* 

13 MYY: *olikos >sii<nä # ee*+ssa. + * 
MYL Aa e ate ate ate aan *käsi tiskin etureunalla* 
asi +katsoo tiskille+...-> 
kuv #Kuval 
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Kuva 1. 


14 *(0.2) H + (0.3) *(0.1) +(0.2)*(0.1) # 
myy *liu'uttaa kättään*............ *tarttuu lehteen-> 
asi ->+katsoo m. kättä+lehteä--> 
kuv #Kuva2 #Kuva3 


Kuva 2. Kuva 3. 


15 MYY: >tuossa<.* 
myy ->*nostaa lehden esiin-> 
16 ASI: o:nhan siinä +joohh. 
asi ->+katsoo lompakkoaan, kaivaa rahoja->> 
17 (0.4)*(0.7) 
myy ->*asettaa lehden tiskille-> 
18 ASI: voi @voi ku* sille #lauralle nyk kavi:#@ 
myy cR 
19 ASI: tuolla [lailla?. 
20 MYY: [mm | : ^m, 
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Katkelmassa toiminta etenee erilaisten vaiheiden kautta pyynnön esit- 
tämisestä (r. 1) sen täyttämiseen. Käsittelemme ensiksi osallistujien kie- 
lellistä ja kehollista orientaatiota lehden etsimiseen. 

Katkelman alussa asiakas osoittaa epävarmaksi, onko lehteä saata- 
villa: lausekemuotoinen pyyntö iltalehti laajentuu kieltomuotoiseksi 
kysymykseksi, joka hakee vastauksekseen kieltoa (r. 1-2 ja uudestaan 
r. 5). Vuoroa tuottaessaan asiakas vilkuilee ympärilleen kuin lehteä ha- 
kien mutta kohdistaa sitten huomionsa lompakon ja laukun käsitte- 
lyyn. Myyjän vastaus vahvistaa lehden saatavuuden (r. 7). Kun myyjä 
on lukenut Iltalehden kiinteän viivakoodin tiskin pinnasta (r. 9), hän 
kumartuu tiskin yli asiakkaan puolelle ja kurkottaa kättään kohti lehti- 
pidikettä (kuva 1). Samalla hän tuottaa kysymykseksi muotoillun vuo- 
ron olikos siinä eessä, jolla osoittaa epävarmaksi, onko mainittuja lehtiä 
jäljellä pidikkeessä. Paikanilmauksen demonstratiivinen osa siinä il- 
maisee alueen olevan vastaanottajan havaittavissa ja relevantti tämän 
toiminnan kannalta (ks. Laury 1997, 77—79). Asiakas osoittaa vastaa- 
vaa tulkintaa kohottamalla katseensa tiskin suuntaan. Nähtyään myy- 
jän tiskin yli kurkottavan käden asiakas seuraa katseellaan sen liikettä 
(r. 13-14, kuva 2), kunnes saavuttaa katseellaan lehden (kuva 3), johon 
myyjä on juuri tarttumassa. Myyjän puhe ja kehollinen toiminta yhdes- 
sä siis kutsuvat asiakkaan kohdistamaan huomionsa edessään olevaan 
lehtivalikoimaan. 

Kun myyjä nappaa lehden, hän ilmaisee sen löytymistä vuorollaan 
tuossa (r. 15). Demonstratiivin valinta osoittaa muuttunutta orientaatio- 
ta lehteen ja sen sijaintiin tilassa (vrt. aiempi siinä). Myyjä ikään kuin 
osoittaa juuri havaitsemaansa lehteä asiakkaalle (Laury 1997, 74-75; 
Etelämäki 2006, 116-117). Asiakas puolestaan vahvistaa joo-loppuisella 
vuorollaan myös havainneensa lehden (r. 16). Tästäkin vuorosta voidaan 
tarkastella piirteitä, jotka osoittavat asiakkaan uutta tulkintaa ympäris- 
töstään lehden löydyttyä. Liitepartikkeli -han ilmaisee äkillistä oivallusta 
(ISK § 830), joka pohjaa juuri edellä kehollisessa vuorovaikutuksessa 
syntyneeseen visuaaliseen havaintoon. Paikanilmauksella siinä asiakas 
käsittelee aivan edessään olevaa, nyt yhteisesti tarkasteltua ja tunnet- 
tua tilaa myyjän toiminnan alueena. Huomattavaa esimerkissä on siis 
muun muassa se, miten demonstratiivikantaisten paikanilmausten siinä 
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ja tuossa käytöllä jäsennetään vuorovaikutuksellista tilaa ja osallistujien 
välisen toiminnan etenemistä. 


Kielellisten resurssien tutkimuksesta: demonstratiivipronominit vuoro- 
vaikutuksessa 


Suomen demonstratiivipronomineista tämä, tuo ja se on tehty vuoro- 
vaikutuksellista tutkimusta, joka täydentää aiempia kielitieteellisiä näke- 
myksiä osoittamalla demonstratiivien käytön sosiaalisen ja vuorovaiku- 
tuksellisen perustan. Demonstratiivit eivät ilmaise vain puhujan ja vas- 
taanottajan etäisyyttä tarkoitteesta vaan jäsentävät osallistujien keskinäi- 
siä vuorovaikutuksellisia asemia ja meneillään olevaa toimintaa, kuten 
esimerkissä nähdään demonstratiivikantaisen (se) paikan adverbin siinä 
käytöstä: vaikka demonstratiivipronominia se on usein pidetty etäisyyt- 
tä osoittavana, voi puhuja viitata sillä välittömässä läheisyydessäänkin 
olevaan paikkaan tai tarkoitteeseen, kun käsittelee sitä vastaanottajan 
toiminnan kohteena. 


Laury (1997) on osoittanut tutkimuksessaan, miten pronominia se käyte- 
tään osoittamaan tarkoitteen tunnettuutta ja että sillä on artikkelimaista 
käyttöä. Seppäsen (1998) tutkimus viittaamisesta läsnäoleviin henkilöi- 
hin taas näyttää, miten viitattaessa demonstratiivipronomineilla läsnä- 
oleviin henkilöihin jäsennetään keskustelun osallistumiskehikkoa ja sen 
muutoksia. Etelämäki (2006) puolestaan osoittaa, miten tämä ja muut 
demonstratiivit suhteuttavat tarkoitteen tunnistamisen meneillään ole- 
vaan toimintaan ja järjestävät taustanaan olevaa keskustelutilannetta. 
Tutkimuksissa keskustellaan myös siitä, millaisten teoreettisten käsit- 
teiden avulla voidaan parhaiten kuvata demonstratiivien indeksikaalisia 
suhteita puhekontekstiinsa. 


Vuorovaikutuksellisen tilan jäsentäminen toimintojen kielellises- 
sä muotoilussa liittyy myös tilanteen institutionaalisuuteen. Myyjällä 
ei institutionaalisesta roolistaan huolimatta olekaan tässä tilanteessa 
ensisijaista pääsyä tuotteeseen, sillä tuote kuuluu asiakkaan itsensä 
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poimittaviin ja on sijoitettu kioskilla tämän mukaisesti. Asetelma näkyy 
myyjän vuorossa, jossa hän osoittaa hakevansa asiakkaan pyytämää leh- 
teä paikasta, johon tällä on ensisijainen kehollinen pääsy. 

Katkelmasta voitaisiin myös lähteä tutkimaan esimerkiksi affektista 
asennoitumista sekä rupattelua (engl. small talk). Rivin 18 vuoron alussa 
asiakas ilmaisee affektista suhtautumistaan Lauran heikkoon menes- 
tykseen interjektiolla voi voi (vrt. Hakulinen & Sorjonen 2012; ks. myös 
Raevaara & Sorjonen 2006) ja vetoaa sitten huonon uutisen jaettuuteen 
(ku sille Lauralle nyt kävi tuolla lailla)". Myyjä vastaa vuorollaan mm} :-m, 
jonka prosodista muotoilua kaksihuippuisena, ensimmäisen osan lo- 
pussa äännettä venyttäen sävelkulun samalla hetkeksi madaltuessa, voisi 
tarkastella samanlinjaisen affektin tuottamisen keinona. Asiakkaan voi 
tässä ajatella esittävän motiivin lehden ostamiselle yhtäältä affektisen 
merkityksen ja toisaalta tiedon jaettuuden pohjalta. Uutisen mainitsemi- 
nen tällä tavalla toimii niin ikään resurssina rupattelulle, joka väljentää 
tilanteen institutionaalisuutta arkisen juttelun suuntaan (Raevaara & 
Sorjonen 2006; Raevaara 2009; 2011). 

Toisessa esimerkissä tuomme esiin, miten keskustelijoiden käyttämiä 
kielellisiä resursseja voidaan tarkastella suhteessa heidän institutionaa- 
lisiin rooleihinsa. Kuten esimerkissä 1 myös esimerkissä 2 on kyseessä 
osto- ja myyntikonteksti. Konteksti eroaa kuitenkin monin tavoin kioski- 
ympäristöstä: nyt kyseessä on kahden yrityksen välinen myyntineuvot- 
telu. Yritysten välisessä kaupankäynnissä myyjän tehtävä on vakuuttaa 
asiakas siitä, että tarjottu palvelu olisi tälle vähintään hintansa arvoinen. 
Asiakas puolestaan usein jarruttelee myyjää ja esittää varauksia, joilla 
esimerkiksi vähättelee tarvettaan ja pyrkii tinkimään tarjotun palvelun 
hinnasta (Niemi & Hirvonen 2019). Myyjän ja asiakkaan tuottamia toi- 
mintoja voidaan tutkia tarkastelemalla niiden sekventiaalista rakentu- 
mista ja kielellistä muotoilua. 

Esimerkissä 2 myyntineuvottelu käydään puhelimitse. Osallistujilta 
siis puuttuu edeltävässä katkelmassa havainnollistettu resurssi toimin- 
nan ymmärrettäväksi tekemisessä: toistensa suoraan havaittavissa oleva 
kehollinen toiminta. Heillä on kuitenkin käytössään jaettu visuaalinen 
kanava eli tietokoneruutu, jota myyjä voi käyttää tarjoamansa palve- 
lun esittelyyn tekstin ja kuvien avulla. Myyjä kauppaa esimerkiksi 
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työajanseurantaan ja työmaapäiväkirjan pitoon käytettävää tietokone- 
sovellusta asiakkaalle, joka edustaa rakennusalalla toimivaa yritystä. On 
käynyt ilmi, että asiakas osallistuu esimerkiksi taloyhtiöiden remonttei- 
hin konsulttina ja osana laajempaa aliurakoitsijoiden joukkoa. Tämän 
tiedon pohjalta myyjä alkaa kartoittaa asiakkaan tarvetta kauppaamansa 
palvelun sovellusmahdollisuuksille. Myyjä esittää esimerkin 2 alussa 
väittämän, joka koskee asiakkaan tietämyksen aluetta (niin kutsuttu B- 
tilanteen väittämä; Labov 1972a, 254; Labov & Fanshel 1977, 100-101). 


Esimerkki 2. (MOV-HAR meett 13:20-13:50) 
M=Myyjä, A=Asiakas 


01 M: joo. .hhhhhhhh lokei eli teillä ei oo (.) mitään 


02 verottajarepo- (0.2) 
03 raportointivelvol[lisuuksia (--), ] 
04 A: [ei o ei o meill ei oo kato semmosia. ] 


05 M: j:oo[h. 


06 A: [et (.) et ei oo ettà et Tmeiàán meiän tarve 

07 oikeestaan on vaan se että (0.4) et tota noin (0.2) 
08 saadaan tämmönen niinku suht reaaliaikanen, (0.4) 

09 työmaapäiväpäivä- (.) päiväkirjajärjestelmä ja (0.4) 
10 tavallaa niinku niitten (0.6) työmaa- (.) vaiheiden 
11 (0.2) dokumentointi ja (0.6) ja, 


12 M: joo-[o. 


13 A: [jakelu. 

14 (0.4) 

15 A: tämmöne (.) tämmöne niin se on se meiän tarve, 
16 (0.4) 


17 M: lokei. 


Myyjàn kieltomuotoinen eksistentiaalilause (r. 1-3; vrt. esimerkin 1 
iltalehti ei kai se teill ole loppun't) toimii polaarisena kysymyksenä, joka 
virittää odotuksen asiakkaan vahvistuksesta. Lauseen kieltohakuinen 
kvanttoripronomini mitään ja monikkomuotoinen, partitiivisijainen 
subjekti (raportointivelvollisuuksia) viittaavat tarkemmin rajaamattomaan 
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luokkaan kaupatun palvelun mahdollisia ominaisuuksia (ISK § 758 ja 
1733; Korpela 2007). Asiakkaan vastauksesta voidaan esimerkiksi tar- 
kastella niitä piirteitä, jotka osoittavat asiakkaan suuntautumisen vuoro- 
vaikutustilanteen laajempaan kontekstiin eli myyjän pyrkimykseen tehdä 
kauppaa. Asiakas vahvistaa ensin kieltomuotoisen väittämän ja osoittaa 
riittävää ymmärrystä myyjän implikoimasta luokasta (semmosia, r. 4; Vil- 
kuna 1992 [1980], 132—133; Erringer 1996; ISK ( 725). Samalla hän imp- 
likoi partikkelilla kato (Hakulinen & Seppänen 1992) vetoavansa siihen, 
että vastaanottaja ymmärtää kieltävän vastauksen. Jatkaessaan vuoroaan 
ja selvittäessään tarpeitaan asiakas käyttää partikkeleita oikeestaan ja vaan 
vähättelemään ja rajaamaan tarvetta (r. 7). Keskustelunanalyyttinen tut- 
kimus voisi tarkastella useampia esimerkkejä analysoimalla sitä, miten 
asiakas muotoilee vastauksensa niin, että tarjoaa paitsi vastauksen esi- 
tettyyn kysymykseen myös suuntautuu tilanteen laajempaan kehykseen 
eli myyjän rooliin liittyvään pyrkimykseen tehdä kauppaa. 

Yksi institutionaalista vuorovaikutusta tarkastelevan keskustelun- 
analyyttisen tutkimuksen linjoista selvittää, miten keskustelijat omilla 
toiminnoillaan rakentavat ja tuovat ilmi tilanteeseen ja omiin rooleihin- 
sa liittyviä odotuksia ja velvollisuuksia (esim. Heritage & Clayman 2010, 
20-22). Esimerkissä 2 asiakkaan voidaan tulkita tuovan esiin oman ym- 
märryksensä vuorovaikutustilanteesta juuri sillä, miten hän muotoilee 
vastauksensa myyjän polaariseen kyllä/ei-kysymykseen: asiakas osoittaa 
ymmärtäneensä, että myyjän kysymys raportointivelvollisuuksista kar- 
toitti hänen mahdollista tarvettaan tietylle tuotteelle, ja vastauksen laa- 
jennus tarjoaa selvityksen näistä tarpeista. Myyjä ottaa partikkelilla okei 
(r. 17) asiakkaan laajan tiedonannon vastaan ymmärrettynä ja riittävänä. 


Toimintojen muotoilu 


Toimintojen muotoilulla tarkoitetaan sitä, miten kieltä, kehoa ja toiminta- 
ympäristön resursseja käytetään rakennettaessa esimerkiksi kutsua, 
valitusta tai samanmielisyyden osoitusta keskustelukumppaneille tun- 
nistettavaksi toiminnoksi. Viime vuosina paljon huomiota ovat saaneet 
esimerkiksi toimintajakson aloittavan pyynnön (Curl & Drew 2008; Drew 
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& Couper-Kuhlen 2014; Rossi 2015), direktiivin (Sorjonen, Raevaara & 
Couper-Kuhlen 2017; ks. myös Lauranto 2015) ja kehun esittäminen 
(Golato 2005; Etelämäki, Haakana & Halonen 2013), mutta tutkimuk- 
sissa on käsitelty myös responsiivisten toimintojen muotoilua (Sorjo- 
nen 2001a; Hakulinen & Sorjonen 2009; Niemi 2015; Thompson, Fox 
& Couper-Kuhlen 2015; Koivisto 2017) ja osoitettu hienovaraisia eroja 
toisistaan muodoltaan vain minimaalisesti eroavien toimintojen välillä. 


Toimintojen muotoiluun liittyy yleisemmän tason ilmiöitä, kuten 
preferenssijäsennys: tietyille toiminnoille voidaan osoittaa odotuksen- 
mukainen eli preferoitu ja epäodotuksenmukainen eli preferoimaton 
responssi — preferoimattoman toiminnan muotoiluun liittyy tyypillisesti 
vuoron viivästyminen tai esimerkiksi selonteon tuottaminen (preferens- 
sistä keskustelun eri ilmiöiden tasolla ks. Pomerantz & Heritage 2013; 
myös Raevaara 2011). Osallistujat ilmaisevat toimintojen muotoilulla 
myös episteemistä eli tiedollista asemaa ja asennoitumista (epistemic 
status/stance, Heritage 2012a; 2012b). Episteemisyys onkin noussut 
2000-luvulla merkittäväksi teemaksi keskustelunanalyysissa. 


Toimintojen tutkimuksessa, kuten keskustelunanalyysissa ylipäänsä, 
kehollisen toiminnan tarkastelu ja ympäristön fyysisten resurssien huo- 
miointi on vahvistunut kielellisen ulottuvuuden rinnalla (Haddington 
& Kääntä 2011; Nevile, Haddington, Heinemann & Rauniomaa 2014). 


Vertaileva ja kieltenvälinen tutkimus. Keskustelunanalyyttinen tutkimus 
on perusolemukseltaan vertailevaa. Tällä tarkoitetaan sitä, että kun kiin- 
nostuksen kohteena olevasta vuorovaikutuskäytänteestä, toiminnosta 
tai toimintakokonaisuudesta on kerätty alustava kokoelma samankal- 
taisia esiintymiä, niitä aletaan tarkastella suhteessa toisiinsa. Koottu- 
jen tapausten piirteitä vertailemalla määritetään, onko kyse samasta il- 
miöstä vai pitäisikö tapauksia jakaa uusiin kokoelmiin, mikä esiintymiä 
yhdistää ja mistä yleisemmästä ilmiöstä on kyse (esim. Haakana, Laakso 
& Lindström 2009; ks. Schegloff 1968 vertailun tärkeydestä ja poikkeus- 
tapauksien käsittelystä). 

Vuorovaikutuskäytänteitä ja toimintoja vertaillaan erilaisista näkö- 
kulmista myös yksittäisiä kokoelmia laajemmin (johdatuksen vertailun 
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muotoihin esittävät Haakana, Laakso & Lindström 2009; ks. myös esim. 
Drew 2003; Sidnell 2009a; 2009b). Arkisen perheen ja ystävien välisen 
keskustelun ja jonkin institutionaalisen tilannetyypin toimintojen ero 
tulee usein selvästi esiin siinä, miten osanottajat käsittelevät toisten- 
sa toimintoja, kuten seuraavissa kahdessa vastauksessa samalla tavalla 
muotoiltuun kysymykseen: 


Esimerkki 3. (Korpela 2007, 18-20) 


A: mitäs kuuluu? 
B: no kiitos siinähän se hurisee minä tässä huokailen vaan 
ku .hh on vähän semmonen niin eh .hh kummallinen olo 


vaan ei meinaa päästä käyntiin nyth oik(h)een, he he .hhh 


A: mitäs kuuluu? 
no nyt on >semmone vaiva ollu vissii kesästä lähtie<, 


et mua painaa, (0.2) tähä. 


Vuoronsa muotoilulla kysymyksen vastaanottajat ilmaisevat suuntautu- 
misensa siihen, millaisessa tilanteensa he ovat ja mitä kysyjä heiltä odot- 
taa (tuttava vastaukseksi kuulumisten kysymiseen; potilas vastaukseksi 
vastaanoton aloittavaan kysymykseen). Samoin erilaisten institutionaa- 
listen vuorovaikutustilanteiden vertaaminen tuo tarkemmin näkyviin 
vuorovaikutuskäytänteiden samankaltaisuudet ja erot tilanteesta toiseen 
sekä sen, millaisiin tilanteen ominaisuuksiin käytänteet liittyvät. Esi- 
merkiksi erot tavoissa, joilla terveyskeskuslääkäri ja homeopaatti kysy- 
vät potilaan elämäntavoista (syömis- ja juomistottumuksista) ja potilaat 
vastaavat kysymyksiin, kertovat ammattilaisten sairautta ja hyvinvointia 
koskevista teorioista ja tavoitteista sekä kummankin osapuolen suuntau- 
tumisesta muihin vastaanottotilanteen piirteisiin (Lindfors & Raevaara 
2.005). 

Kiinnostava kysymys on vuorovaikutuskäytänteiden samankal- 
taisuus ja vaihtelu eri kielten ja kulttuurien välillä: mikä on samaa 
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kieliyhteisöstä ja kulttuurista toiseen ja mikä vaihtelee. Keskustelun- 
analyyttista tutkimusta yhdistää kiinnostus yleisiin vuorovaikutuksen 
piirteisiin ja tarpeisiin, joihin puhujat luovat ratkaisuja kunkin kielen 
omien resurssien ja sosiokulttuuristen yhteisöjen omien rakenteiden 
puitteissa. Keskustelu metodisista valinnoista ja perusoletuksista tällä 
alueella on vilkasta. Lähestymistavat vaihtelevat keskustelunanalyyt- 
tisen tutkimuksen pohjalta laadittujen koodausten ja kvantifioinnin 
käyttämisestä (esim. Enfield, Stivers & Levinson 2010, kysymys- 
responssi-jaksot 10 kielessä) laadullisiin tutkimuksiin, joissa eri kiel- 
ten tutkijat tarkastelevat samaa aihepiiriä oman kielensä näkökulmasta 
(esim. Sorjonen, Raevaara & Couper-Kuhlen 2017, imperatiivin sisältä- 
vät vuorot 1o kielessä). 

Kieltenvälisten tutkimusten painopiste vaihtelee selvemmin kielelli- 
sestä fokuksesta (esim. kielioppi, kieltomuotoiset kognitiiviset verbit ja 
episteemisyys, Lindström, Maschler & Pekarek Doehler 2016) enem- 
män toiminnalliseen fokukseen (esim. kognitiivisen muutoksen ilmai- 
seminen, Heinemann & Koivisto 2016; kutsun esittäminen, Margutti, 
Tainio, Drew & Traverso 2018). Kahden kielen käytänteitä on vertailtu 
esimerkiksi keskustelijoiden välisen työnjaon ilmaisemisessa (sinä teet x 
niin minä teen y -rakennetyyppi), pyyntöjen esittämisessä ja päällekkäis- 
puhunnassa (Vatanen 2014; Couper-Kuhlen & Etelämäki 2014; Zinken 
2016). Saman kielen eri maissa puhuttavissa kielimuodoissa puolestaan 
on vertailtu esimerkiksi puhuttelukäytänteitä (ruotsin- ja suomenruotsi; 
Norrby, Wide, Nilsson & Lindström 2018). 

Tilanteiden ja osallistujien moninaisuus, soveltava tutkimus. Vuoro- 
vaikutuksen jäsennyskeinoja valaisevat myös tilanteet, joissa osallistu- 
jilla on toisistaan merkittävästi tiettyjen piirteiden suhteen eroavat kie- 
lelliset tai vuorovaikutukselliset resurssit. Epäsymmetristen tilanteiden 
tarkastelu tuo korostetusti näkyviin niin yhteisymmärryksen rajoitteet 
kuin sen rakentamisen keinot. Klassikoksi ovat muodostuneet Charles 
Goodwinin (esim. 1995; 2007) tutkimukset siitä, miten afaattinen osal- 
listuja rakentaa kolmea sanaa (and, yes, no) hyödyntämällä toimintaansa 
muiden tuottaman puheen varaan. 

Vuorovaikutusresurssien epätasainen jakautuminen ja toisten 
puheen varaan rakentaminen tulevat esiin myös lasten ja aikuisten 
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kielenoppimisessa, toisen kielen käytössä (Gardner & Wagner 2004; 
Kurhila 2006; Hall, Hellermann & Pekarek Doehler 2011; Savijärvi 2011; 
Merke 2016; Kotilainen, Kurhila & Kalliokoski 2019; Lilja & Tapaninen 
2019) ja monikielisessä vuorovaikutuksessa (Bolden 2012; Frick 2013; 
Henricson 2013; Harjunpää 2017; Paananen 2017; Plejert, Lindholm & 
Schrauf 2017). Näiden alojen keskustelunanalyyttisellä tutkimuksella 
on yhteys (vuorovaikutus)sosiolingvistiikkaan, ja alat risteävät erityi- 
sesti koodinvaihdon ja muiden monikielisten käytänteiden tarkaste- 
lussa (esim. Auer 1998; Nilep 2006; Filipi & Markee 2018; ks. myös 
Sosiolingvistiikka; Kielikontaktien tutkimus, luku 3.2. tk.). Painotukset 
ovat kuitenkin erilaisia: kielen variaation, muutoksen, kielenvaihdon 


ja kieli-ideologioiden kaltaisten teemojen sijaan keskustelunanalyytti- 
nen tutkimus kohdistuu tyypillisesti siihen, miten toiminta jäsentyy 
paikallisesti moninaisten kielellisten resurssien avulla. Usean kielen 
käyttöä samassa tilanteessa voi lähestyä esimerkiksi sen kannalta, kuin- 
ka vuorovaikutuksen kielivalinta tehdään osana tilanteeseen kuuluvaa 
toimintoa (tervehtiminen asioinnin alussa, Hazel 2015; Mondada 2018) 
tai miten kielten käyttö jäsentää osallistumista monenkeskisessä tilan- 
teessa (kokousten kulku monikielisillä työpaikoilla, Mondada 2012b; 
Traverso 2012). Olennaista on myös sen osoittaminen, mitkä seikat eivät 
palaudu kieliasetelmaan sinänsä vaan muuhun toiminnan jäsentymi- 
seen (Kurhila 2006, 221-225). 


Kielierojen paikkaamisen keinot ja toimintakonteksti 


Epäsymmetrisissä monikielisissä tilanteissa paikataan yhteisen kielen 
puuttumista esimerkiksi korjausjäsennyksen ja kääntämisen keinoin. 
Savijärvi (2011) on tutkinut, miten suomenkieliset lapset oppivat ruot- 
sia toisena kielenä kielikylpypäiväkodissa. Tutkimuksen pitkittäinen 
näkökulma tuo näkyviin sen, miten keinot toimia epäsymmetrisessä ti- 
lanteessa muotoutuvat yhteisen toiminnan edetessä ja kielitaidon kart- 
tuessa. Ensimmäisten kuukausien aikana lapset tukeutuvat kielen sijasta 
muuhun tilanteen ja toiminnan ymmärrettävyyteen. He alkavat tehdä 
korjausaloitteita eli osoittaa ymmärrysongelmia vasta siinä vaiheessa, 
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kun jo ymmärtävät ruotsinkielisten ohjaajien puhetta. Tarkastelemalla 
monikielisiä tilanteita multimodaalisesta näkökulmasta voidaankin tuo- 
da näkyviin piirteitä, joihin osallistujien vuorovaikutuksellinen toimin- 
ta nojaa tietyn kielen osaamisen lisäksi. Harjunpään (2017) tutkimus 
suullisesta kääntämisestä arkikeskusteluissa muun muassa osoittaa, 
että käännösvuorojen tuottamista voi ohjata kehollinen neuvottelu sen 
osallistujan osallistujaroolista, jonka ymmärrystä kääntämällä edesaute- 
taan. Käännösvuorot poikkeavat usein muodoltaan ja sisällöltään kään- 
nettävästä vuorosta, sillä käännösvuorot sovitetaan erilaisin käytäntein 
meneillään olevaan toimintaan, vuoron sekventiaaliseen asemaan ja 
osallistumiskehikon muutoksiin. Tutkimukset siis näyttävät, miten osal- 
listujien tapa käsitellä tietyn kielistä puhetta ja sen ymmärtämistä kytkey- 
tyy muuhun vuorovaikutuksen ja toiminnan jäsentymiseen. 


Yleisemmin tutkimuksen avulla voidaan täsmentää ja muokata ymmär- 
rystä kielellisen ja vuorovaikutuksellisen epäsymmetrian luonteesta ja 
seurauksista. Niin sanottujen epätyypillisten vuorovaikutustilanteiden 
tutkimus on otollinen kenttä soveltavalle tutkimukselle, sillä tuloksia on 
mahdollista hyödyntää eri instituutioiden toiminnan kehittämisessä. Käy- 
tännön tarpeista on noussut kiinnostus erityisesti vuorovaikutukselle haas- 
teita tuottaviin afasiaan, dementiaan ja kuulo-ongelmiin, joiden hoito- ja 
kuntoutuskäytänteiden kehittämiseksi on tutkittu etenkin viime aikoina 
vuorovaikutusta arkisissa tilanteissa (esim. Leskelä & Lindholm 2012; Pajo 
2013; Laakso 2005; 2015; Stevanovic & Lindholm 2016, luku II). 
Soveltavan tutkimuksen ominaispiirre on, että tutkijat tekevät yhteis- 
työtä tutkittujen yhteisöjen ja niiden toimijoiden kanssa. Esimerkiksi 
Kelan puhelinpalvelun vuorovaikutuksen tutkimuksessa aihepiirit, joita 
tutkimukset koskivat (esim. puhelun aloitus, asiakkaan kuunteleminen 
ja siirtyminen asian käsittelyyn), valittiin tutkijoiden ja Kelan toimijoi- 
den yhteistyönä. Myös prosessin aikana pidettiin yhteisiä palaute- ja 
ideointisessioita ja lopuksi julkaistiin laaja raportti (Raevaara, Sorjonen 
& Lappalainen 2013), joka sisälsi kiteytyksen tutkimuksessa selville saa- 
duista hyvistä käytänteistä. Soveltava tutkimus on kohdistunut myös 
muun muassa sosiaali- ja terveydenhuollon tilanteisiin, kuten yleis- 
lääkärin vastaanottoihin ja psykoterapiatilanteisiin (Sorjonen, Peräkylä 


924 KATARIINA HARJUNPÄÄ, JARKKO NIEMI JA MARJA-LEENA SORJONEN 


& Eskola 2001; Tiitinen 2015; Weiste & Voutilainen 2016; Lindholm 
& Leskelä 2018; Paananen 2019) ja työpaikan sisäisiin keskusteluihin 
(esim. Asmuß & Svennevig 2009; Lehtinen & Pälli 2016; Nissi & Leh- 
tinen 2016; Mikkola & Lehtinen 2019). 

Tutkimusta on sovellettu toiminnan kehittämiseen myös erilaisis- 
sa oppimisympäristöissä, erityisesti kielenoppimisessa (esim. Kurhila 
& Kotilainen 2017; ks. myös Kieliopin tutkimus ja kielioppiteoriat tk.). 


Uusi tutkimuksen sovellusalue on yritysmarkkinointi, jossa on tutkittu 
muun muassa vapautuneen tunnelman ja asiakasluottamuksen raken- 
tamista kahden yrityksen välisessä myyntineuvottelussa (Kaski, Niemi 
& Pullins 2018; Humä, Stokoe & Sikveland 2019; Niemi & Hirvonen 
2019). Soveltava näkökulma tuo perustutkimuksen tutkijoiden, yhteis- 
kunnan toimijoiden ja kansalaisten käyttöön. 


4. Yhteenveto ja tulevaisuuden näkymiä 


Keskustelunanalyyttisen tutkimuksen ytimessä on tavoite ymmärtää so- 
siaalisen vuorovaikutuksen toiminnallista jäsentymistä ja keinoja, joilla 
keskustelun osanottajat tuottavat ja tulkitsevat sosiaalista toimintaa. Pu- 
hetta tarkastellaan aina suhteessa muihin vuorovaikutuksen resurssei- 
hin, vuorotteluun ja vuorojen sekventiaaliseen kontekstiin sekä näiden 
paikalliseen muotoutumiseen. Vuorovaikutuslingvistiikassa keskitytään 
samoista lähtökohdista tutkimaan kielen rakenteita ja niiden käytön 
vuorovaikutuksellista perustaa. Keskusteluntutkijan ja vuorovaikutus- 
lingvistin analyyttiseen työkalupakkiin sisältyy käsitys keskustelun ylei- 
sistä perusjäsennyksistä, joiden avulla saadaan esiin ja voidaan todentaa 
keskustelun osanottajien tilanteessa jakamia vuorovaikutuskäytänteitä. 
Toistuvia käytänteitä havainnoimalla puolestaan kasvatetaan yleistettä- 
vää ja eri tavoin sovellettavaa tietoa siitä, kuinka keskusteluvuorovaiku- 
tus jäsentyy reaaliaikaisesti. 

Keskustelunanalyytikot ja vuorovaikutuslingvistit tekevät yhteistyötä 
eri alojen tutkijoiden kanssa, ja metodia hyödynnetään useilla aloilla. 
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Aktiivista yhteistyötä on myös muiden kielentutkimuksen suuntaus- 
ten kanssa, kuten Suomessa kognitiivisen kielitieteen ja konstruktio- 
kieliopin edustajien kanssa (esim. Etelämäki, Herlin, Jaakola & 
Visapää 2009; Seppänen & Herlin 2009; Helasvuo & Huumo 2010; 
Haddington, Jantunen & Sivonen 2011; Etelämäki, Herlin, Möttönen 
& Visapää 2016). Tutkimusyhteistyötä on tehty myös esimerkisi sosio- 
lingvistien (esim. Sorjonen, Rouhikoski & Lehtonen 2015) ja kirjallisuu- 
dentutkijoiden (esim. Koivisto & Nykänen 2013; 2016) ja laajasti sosiaali- 
tieteiden edustajien kanssa. 

Keskustelunanalyysi laajentuu yhtäältä kattamaan kielellistä ja kult- 
tuurista vaihtelua ja erilaisten vuorovaikutustilanteiden kirjoa. Toisaalta 
se haastaa entistä voimakkaammin kieleen rajoittuvan tarkastelun riittä- 
vyyden vuorovaikutuksen ja jopa kieliopin tutkimuksessa (esim. Keevallik 
2018). Tämä valaisee entistä selvemmin kielen ja kehollisuuden suhdetta 
ja sitä, millä tavalla ja missä määrin kieli on läsnä erilaisissa vuorovai- 
kutustilanteissa. Muista näkökulmista yleistymässä on muun muassa 
pitkittäinen keskustelunanalyyttinen tutkimus, jossa tarkastellaan vuoro- 
vaikutuskäytänteiden ja kielenkäytön muuttumista tietyllä aikavälillä 
(Deppermann 2018; Pekarek Doehler, Wagner & Gonzälez-Martinez 
2018). Lisäksi teknologiavälitteinen vuorovaikutus (pikaviestimet ym.) ja 
muu teknologian käyttö arjessa ja työelämässä on nousemassa merkit- 
täväksi keskustelunanalyysin sovellusalueeksi (Giles, Stommel, Paulus, 
Lester & Reed 2015; Stommel, Paulus & Atkins 2017; Meredith 2019). 

Keskustelunanalyysin metodia sovellettaneen jatkossa yhä useammin 
erilaisissa työelämän vuorovaikutuksen konteksteissa, muita tieteenaloja 
edustavien tutkimusten ja tutkijoiden rinnalla (esim. Kaski, Niemi & 
Pullins 2018). Tutkijat ja tutkittavat saavat myös uudenlaisia rooleja 
erilaisten toimintatutkimusten myötä. Monialaisissa työryhmissä voi 
työskennellä eri alojen tutkijoiden lisäksi esimerkiksi toimittajia ja tai- 
teilijoita. Aineistopohja voi laajeta niin, että tyypillisen vuorovaikutus- 
aineiston lisäksi hankkeissa käsitellään vaikkapa haastatteluja ja teks- 
tejä. Monialaisissa työryhmissä syntyy myös uudenlaisia tapoja kertoa 
hankkeiden työstä ja tuloksista. 
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Aiheesta lisaa: 


Clift, Rebecca. 2016. Conversation Analysis. Cambridge: Cambridge 
University Press. 


Couper-Kuhlen, Elizabeth & Selting, Margret. 2017. Interactional 
Linguistics. Studying Language in Social Interaction. Cambridge: 
Cambridge University Press. 


Sidnell, Jack & Stivers, Tanya (toim.). 2012. The Handbook of Conversation 
Analysis. Chichester: Wiley-Blackwell. 


Stevanovic, Melisa & Lindholm, Camilla (toim.). 2016. Keskustelun- 
analyysi. Kuinka tutkia sosiaalista toimintaa ja vuorovaikutusta. Tampere: 
Vastapaino. 


Tainio, Liisa. 1997. Keskustelunanalyysin perusteet. Tampere: Vastapaino. 


VIITTEET 


Keskustelunanalyysin syntyaika oli angloamerikkalaisessa tutkimuksessa aikaa, jolloin 
liikehdintää tapahtui useilla tieteenaloilla ja yhteiskunnasta, kielestä ja sosiaalisesta 
vuorovaikutuksesta eri tavoin kiinnostuneet tutkijat — sosiolingvistit, lingvistisen antro- 
pologian edustajat sekä etnometodologit ja keskustelunanalyytikot — olivat tiiviissä 
yhteistyössä (Gumperz & Hymes 1972; Bauman & Sherzer 1974). 

Huomionarvoista on, että artikkeleista kaksi, Sacks, Schegloff & Jefferson (1974) ja 
Schegloff, Jefferson & Sacks (1977), julkaistiin pohjoisamerikkalaisen kielentutkimuksen 
lippulaivajulkaisussa Language. 

Levinson luki diskurssianalyysiin tekstikieliopin tutkijat ja diskurssia puheaktiteorian 
pohjalta tutkivat (esim. Sinclair & Coulthard 1975; Labov & Fanshel 1977). 

Ryhmään kuuluivat alussa Pia Purra, Liisa Raevaara, Eeva-Leena Seppänen, Marja-Leena 
Sorjonen ja Liisa Tainio sekä hieman myöhemmin myös Sara Routarinne. 

Jefferson oli toimittamassa Sacksin luentoja kirjaksi ja lähetti luennot monisteina Haku- 
liselle sitä vastaan, että sai ne takaisin ylimääräisten kopioiden kanssa. 

Kuten Levison myös Hakulinen (1989) luki diskurssianalyysiin tekstikieliopin ja puhe- 
aktiteorian pohjalta kehitetyn diskurssintutkimuksen. Myöhemmin, vuonna 1997 
ilmestyneessä oppikirjassa suomalaiset keskustelunanalyytikot erottivat termit kes- 
kustelunanalyysi ja keskusteluntutkimus. Ensin mainitulla viitattiin etnometodologiseen 
keskustelunanalyysiin (engl. conversation analysis, CA), jälkimmäinen taas oli kattotermi, 
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joka viittasi millaiseen tahansa tapaan tutkia keskustelupuhetta. (Tainio 1997, 10; ks. 
myös Tieteen termipankki s.v. keskustelunanalyysi.) 

7 Span konferenssin järjestivät Saksassa työskennelleet Margret Selting ja Elizabeth 
Couper-Kuhlen, Helsingin konferenssin Auli Hakulinen ja Englannissa työskennellyt Bill 
Wells. 

8 Kielten välillä on kuitenkin eroja siinä, missä vaiheessa erilaisia kielen rakenteita enna- 
koidaan (projisoidaan) (ks. Couper-Kuhlen & Selting 2017). 

9 https://www.internationalphoneticassociation.org/content/full-ipa-chart. 

10 Praat on digitaalinen puheen analyysiin tarkoitettu ilmaisohjelma. Sen kehittivät 1992 
ja sitä päivittävät Paul Boersma ja David Weenik Amsterdamin yliopistossa (Institute of 
Phonetic Sciences). Ohjelman voi ladata osoitteesta http://www.fon.hum.uva.nl/praat/. 


11 Lehden etusivun uutisena on juuri päättynyt Eurovision laulukilpailu ja Suomen edusta- 
jan Laura Voutilaisen sijoitus kilpailussa. 
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Liitteet 
Liite 1 
KESKUSTELUNANALYYTTISET PUHEEN LITTEROINTIMERKIT 
Sävelkulku ja sävelkorkeus: 
laskeva sävelkulku 


; lievásti laskeva sávelkulku 
p tasainen sävelkulku 


v 


nouseva sävelkulku 
ympäröivää puhetta korkeammalta aloitettu tai sanottu jakso 


—— 


ympäröivää puhetta matalammalta aloitettu tai sanottu jakso 


Painotus ja puhenopeus: 

painotettu sana tai sanan osa on alleviivattu (esim. se lomake) 
ympäröivää puhetta hiljaisemmin sanottu jakso 

>< ympäröivää puhetta nopeammin sanottu jakso 

<> ympäröivää puhetta hitaammin sanottu jakso 


Sanojen kesto: 

- kesken jäänyt sana (esim. se lap- eiku lomake) 

< sanan loppu tavallista lyhyemmin sanottu (esim. se lisä vai mikä<) 
äänteen venytys (esim. se ko::rkea talo) 

kaksi sanaa on lausuttu yhteen; legatoääntämys (esim. täss on tää) 
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Muita esitystapaa koskevia seikkoja: 


£ hymyillen sanottu jakso 

@ äänen laadun muutos 

(h) naurua (tai hengitystä) sanan sisällä 

joo piste sanan edessä: sana on lausuttu sisään hengittäen 

.hhh piste h:n edessä: sisään hengitys (yksi h on sekunnin kymmenesosa) 


hhh uloshengitys 


Tauot, päällekkäispuhunta: 
(0.7) tauko ja sen kesto sekunteina 
() 
9) 


= tauotta toisiinsa liittyvät puhunnokset 


[ 
] 


mikrotauko (alle 0.2 sekuntia) 
mikrotaukoa pidempi mittaamaton tauko 


päällekkäispuhunnan alku 
päällekkäispuhunnan loppu 


Epäselvät kohdat ja litteroijan kommentit: 


(kas) sulkeissa epäselvästi kuultu jakso 
(-) jakso, josta ei ole saatu selvää 
Liite 2 


Multimodaaliset litterointimerkit (täydempi versio ja ohjeistus saatavilla osoitteessa 
https://www.lorenzamondada.net/multimodal-transcription). 


x x Kehollinen liike merkitään kahden 

+ + samanlaisen symbolin väliin (erilainen symboli jokaista osallistujaa varten) ja 
kohdennetaan vastaavien puhejaksojen/taukojen kanssa. 

* Merkitty toiminta jatkuu toisella rivillà 

---->* uuteen samanlaiseen symboliin saakka. 

>> Toiminta on alkanut ennen aineistokatkelman alkua. 

--->> Toiminta jatkuu aineistokatkelman päätyttyä. 


vai Valmisteluvaihe. 

---- Liikkeen huippuvaiheen/täyden laajuuden saavuttaminen ja ylläpito. 
ni Vetáytymisvaihe. 

asi/myy Liikkeen tuottajan tunniste merkitään, jos eri kuin senhetkinen puhuja. 
Kuva Kuvapysäytyksen tarkka ajoitus merkitään 

# meneillään olevaan vuoroon ristikkomerkillä. 
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Luku 23 Käännöstiede ja sen 
menetelmät 


Liisa Tiittula 
O https://orcid.org/0000-0002-4688-0854 


Leena Kolehmainen 


O https://orcid.org/0000-0003-2746-7201 


Mikä? 


Käännöstiede on termi, joka kattaa sekä kääntämisen että tulkkauksen 


tutkimuksen. Tutkimuksessa, jota tehdään sekä historiallisesta että nyky- 


aikaan keskittyvästä näkökulmasta, käytetään erilaisia aineistoja ja me- 


netelmiä tutkittaessa esimerkiksi seuraavia alueita: 
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kääntämisen ja tulkkauksen tuotteita (käännöksiä ja tulkkeita), 
käännös- ja tulkkausprosessia, 

käännösten ja tulkkeiden vastaanottoa ja käyttöä (lukijoita, kuulijoita 
jne.), 

kääntäjiä, tulkkeja, kielentarkastajia, toimeksiantajia, kustantajia jne. 
(toimijoita), 

kääntämisen ja tulkkauksen toiminta- ja esiintymisympäristöjä, 
kääntäjien ja tulkkien tiedonhankintaa ja apuvälineitä sekä 
kääntäjien ja tulkkien koulutusta. 
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Katso myös: 

Luku 5 Lingvistinen etnografia toimintayhteisöissä 
Luku 8 Käsiteanalyysi kielentutkimuksessa 

Luku 9 Korpusaineistot 


Luku 10 Määrällinen korpuslingvistiikka 


1. Johdanto 


Roman Jakobson (2000 [1959]) jakoi kääntämisen kieltenväliseen, 
kielensisäiseen ja intersemioottiseen kääntämiseen. Näistä ensiksi 
mainittu ja sen tutkimus muodostavat käännöstieteellisen tutkimuksen 
perinteisen ytimen. Yhä useammat tutkijat tarkastelevat kuitenkin myös 
kielensisäistä (mukaelmat, siirtymä kirjoitetusta moodista suulliseen ja 
päinvastoin) ja intersemioottista (siirtymä merkkijärjestelmästä toiseen) 
kääntämistä, sillä monet käännösviestinnän osa-alueet sisältävät kompo- 
nentteja useammasta Jakobsonin erottamasta luokasta (esim. kirjoitus- 
tulkkaus, kuvailutulkkaus ja ohjelmatekstitys). 

Kääntäminen ja sen tutkimus on ollut tapana jakaa osa-alueisiin 
tekstilajeittain kirjallisuuden kääntämiseen (kauno- ja tietokirjallisuus), 
asiatekstien kääntämiseen (lait, sopimukset, todistukset, esitteet jne.) 
ja av-kääntämiseen (audiovisuaalinen kääntäminen: tv-ohjelmien, elo- 
kuvien, oopperan jne. tekstitys, selostusteksti, ohjelmatekstitys, dub- 
baus, verkkosivujen ja pelien kääntäminen). Tulkkausta ja sen tut- 
kimusta taas voidaan lähestyä tulkkausmenetelmästä (simultaani-, 
konsekutiivi-, kuiskaustulkkaus) tai tulkkaustilanteesta käsin (oikeus-, 
asioimis-, konferenssi-, neuvottelutulkkaus), teknologiset mahdolli- 
suudet huomioiden (lähi- ja etätulkkaus), kielimuodon näkökulmas- 
ta (puhuttujen kielten vs. viittomakielen tulkkaus) tai erityiskohde- 
ryhmä ja aistirajoite huomioiden (kuvailutulkkaus, kirjoitustulkkaus, 
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puhevammaistulkkaus, taktiilitulkkaus). Mahdollisesti tuorein jaottelu 
koskee toimijoita: maallikko-, fani-, vapaaehtois- ja joukkoistetun kään- 
tämisen ja tulkkauksen tutkimus on ammattikääntäjien ja -tulkkien toi- 
minnan tutkimuksen rinnalle kehittynyt uusi tutkimussuuntaus. Kään- 
nöstieteen alaan luetaan usein myös lähikäsitteet tekninen viestintä ja 
lokalisointi: Ensimmäisellä tarkoitetaan työtehtäviä, joissa henkilö vastaa 
erilaisten teknisten tekstien ja dokumenttien, kuten käyttöohjeiden tai 
huolto- ja asennusoppaiden, kirjoittamisesta ja päivittämisestä. Jälkim- 
mäinen taas viittaa tuotteiden, kuten tietokoneohjelmien ja -pelien, so- 
vittamiseen eri kieli- ja kulttuuriympäristöjen käyttäjille sopiviksi. 

Joskus käännöstieteen rinnalle nostetaan omana suuntauksenaan 
tulkkaukseen keskittyvä tulkkaustiede. Tässä artikkelissa käytämme 
yläkäsitteenä käännöstiedettä ja tarkastelemme sekä kääntämistä että 
tulkkausta. Koska käännöstiede on tutkimuskohteiltaan monialainen, 
tutkijat käyttävät samoja menetelmiä kuin lähitieteenaloilla käytetään, 
erityisesti kielitieteessä (esim. korpustutkimus, vertaileva tekstintutki- 
mus), kirjallisuustieteessä ja yhteiskuntatieteissä (esim. kysely, haas- 
tattelu, havainnointi). Yhtymäkohtia on lukuisiin muihinkin tieteen- 
aloihin, esimerkiksi kulttuurintutkimukseen, historiantutkimukseen, 
tietojenkäsittelytieteeseen ja kognitiotieteeseen. 

Seuraavassa luodaan katsaus käännöstieteelliseen tutkimukseen, sii- 
hen, millaisin aineistoin ja analyysimenetelmin ja mihin tarkoituksiin 
kieltä, tekstejä ja vuorovaikutusta analysoidaan käännöstieteessä. Ha- 
vainnollistamme tutkijoiden hyödyntämiä aineistoja ja aineistonkeruu- 
menetelmiä sekä analyyseissa käyttämiä metodeja. Käännöstieteelliset 
tutkimukset ovat yhä useammin monimetodisia ja moniaineistoisia: 
tutkijat lähestyvät tutkimuskysymystään eri näkökulmista ja valottavat 
sitä eri aineistoin ja metodein, ja monimenetelmäisellä otteella voidaan 
vastata uudenlaisiin tutkimuskysymyksiin. 

Keskitymme kieleen, kirjoitettuihin ja puhuttuihin teksteihin, 
niiden tuottamisen ja vastaanottamisen prosesseihin sekä niiden 
käännöstieteelliseen analyysiin ja toimijoihin. Tästä syystä esimer- 
kiksi kääntäjien tiedonhankintaa ja apuvälineitä sekä koulutusta kos- 
keva käännöstieteellinen tutkimus rajautuu artikkelin ulkopuolelle. 
Lähitutkimussuuntauksista tarkastelematta jäävät terminologinen 
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(ks. Käsiteanalyysi kielentutkimuksessa tässä kirjassa) ja viittomakielen 
tulkkauksen tutkimus, joista molemmat ansaitsisivat kokonaan omat 
artikkelinsa. Myös konekääntäminen ja käännösteknologia omana 
tutkimuskohteenaan jää pois. 

Luomme ensin lyhyen katsauksen käännöstieteen historiaan (luku 2). 
Sitä seuraa kuvaus käännöstieteen tutkimuskohteista, metodeista ja ai- 
neistoista (luku 3): esittelemme ensin historiallisesti perinteikkäimmän 
tutkimuskohteen eli käännettyjen tekstien ja tulkkeiden tutkimuksen 
(luvut 3.1. ja 3.2.), jonka jälkeen siirrymme kääntämisen ja tulkkauk- 
sen prosessien (3.3.) ja siihen läheisesti liittyvään toimijoiden, toiminta- 
ympäristön ja vastaanoton tutkimukseen (3.4.). Viimeinen luku 4 ko- 
koaa keskeisiä tendenssejä yhteen. 


2. Käännöstieteen historiaa ja taustaa 


Kielikäsitys 


Käännöstieteessä käsitys kielestä vaihtelee niin tutkimussuunnittain kuin 
historiallisesti. Kieli nähdään usein välineenä: yhteinen kieli mahdollistaa 
vuorovaikutuksen eri osapuolten välille, yhteisen kielen puuttuminen 
taas muodostaa esteen viestinnälle. Kääntäjät ja tulkit luovat sillan osa- 
puolten välille, kun erilaiset kieliresurssit ovat vuorovaikutuksen esteenä 
tai kun aistivamma tai muut toimintarajoitteet vaikeuttavat viestinnän 
saavutettavuutta. He mahdollistavat kielellisten oikeuksien toteutumi- 
sen tilanteissa, joissa oman kielen käyttö taataan esimerkiksi erikielisten 
viranomaisten kanssa asioitaessa. 


Käännöstieteessä kielikäsitykseen kuuluu käsitys kielten välisistä suhteis- 
ta eli toisenkielisen käännöksen tai tulkkeen tuottamisen ehdoista, siitä, 
miten yhden kielen viestin pohjalta tuotetaan toisella kielellä uusi viesti 
uudelle vastaanottajalle ja uuteen tarkoitukseen. Käännöstieteen histo- 
riassa, erityisesti konekääntämisen alkuaikoina, kieltenvälisiä suhteita 
pidettiin varsin suoraviivaisina vastaavuuksina ja kääntäminen näyttäytyi 
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mekaanisena toimintana. Nykyään painottuu näkemys kieltenvälisten 
suhteiden kompleksisuudesta. Kieltä tarkastellaankin usein suhtees- 
sa kulttuuriin, puhujayhteisöihin, erilaisiin yleisöihin ja vastaanottaja- 
profiileihin, ideologisiin kysymyksiin, kuten valtaan, sekä vuorovaikutuk- 
sen esiintymiskontekstiin: Uuden erikielisen viestin funktio ja kontekstin 
tai toimintaympäristön sanelemat reunaehdot muodostavat keskeisiä 
kääntämiseen ja tulkkaukseen vaikuttavia asioita. Lisäksi kieli toimii osa- 
na multimodaalista kokonaisuutta. Kieli on käännöstieteessä keskeinen 
tiedon vaihtoon ja liikkumiseen liittyvä väline (engl. knowledge transfer). 
Se on myös esteettinen ilmiö, joka mahdollistaa taide-elämyksen. 


Kirjallisen kääntämisen ja suullisen tulkkauksen tutkimuksen perinteet 
ovat varsin erilaiset, minkä vuoksi niitä käsitellään seuraavassa ensin 
erikseen. Molemmissa kyse on kuitenkin pohjimmiltaan kielten- ja 
kulttuurienvälisen viestinnän välittämisestä. Myöskään raja kirjallisen ja 
suullisen välillä ei ole aina selvä. Esimerkiksi prima vista -tulkkauksessa 
tehdään kirjoitetusta lähdetekstistä valmistelematon suullinen käännös, 
tekstityksessä puolestaan käännetään puhetta kirjoitettuun muotoon. 


2.1. Kääntämisen tutkimus 


Kääntäminen toimintana on ikivanhaa, ja kääntämisen kysymyksiä on 
tarkasteltu kauan ennen kuin voi puhua varsinaisesta tutkimuksesta. 
Kääntämisen perinteisiä kysymyksiä ovat lähde- ja kohdetekstin suhde 
ja niiden vastaavuus sekä kääntämisen uskollisuus vs. vapaus (vrt. esim. 
Chesterman 2016 [1997]). Näiden kysymysten merkitystä länsimaises- 
sa käännöstutkimuksessa ja kääntämistä koskevassa keskustelussa on 
selitetty uskonnollisten tekstien keskeisyydellä kääntämisen historiassa 
(esim. PrunC 2007). Toinen keskeinen alue on ollut kaunokirjallisuuden 
kääntäminen, jonka kysymyksiä on jo satojen vuosien ajan pohdittu. 
Käännöksiä on tutkittu monilla tieteenaloilla: teologiassa on tutkit- 
tu Raamatun ja muiden pyhien tekstien käännöksiä, vertailevassa kir- 
jallisuuden tutkimuksessa on tarkasteltu kirjallisuuden käännöksiä, ja 
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kielitieteessä erityisesti kontrastiivinen tutkimus on ollut kiinnostunut 
käännöksistä. Käännöstiede omana tieteenalana on varsin nuori; sen 
katsotaan syntyneen 1900-luvun loppupuoliskolla, jolloin se irtaantui 
keskeisistä emotieteistä, kieli- ja kirjallisuustieteistä (käännöstieteen his- 
toriasta ks. esim. Munday 2012; Pruné 2007). 

Kielitieteen piirissä syntyi niin sanottu lingvistinen käännöstiede 
1960-luvulla (mm. Catford 1965). Taustalla oli usko konekääntämi- 
seen ja pyrkimys luoda kieliparien välille käännöksiä tuottavia sääntöjä, 
käännöskielioppeja. Tarkastelu kohdistui lähinnä sanatasolle, eikä lauset- 
ta suurempia kokonaisuuksia juuri huomioitu. Kääntäminen nähtiin me- 
kaanisena korvaamisena, jossa yhden kielen ilmaisu oli suoraviivaisesti 
toisinnettavissa toisen kielen ilmaisulla. Keskeinen käsite oli ekvivalenssi 
(vastaavuus), jota luokiteltiin eri tavoin (esim. Koller 1979). Tekstiling- 
vistiikan myötä tarkastelu siirtyi laajempiin kokonaisuuksiin, myös teks- 
tien funktioihin sekä viestintään ja viestin vastaanottajiin. Esimerkiksi 
Eugene Nida (1964), jonka ajattelun taustalla oli Raamatun kääntäminen, 
erotti muodollisen ja dynaamisen ekvivalenssin ja korosti jälkimmäisen 
merkitystä: muodollinen tarkka käännös on usein jäykkä, kun taas dynaa- 
misesti ekvivalentti käännös pyrkii saamaan käännöksen vastaanottajassa 
saman vaikutuksen kuin lähdeteksti on saanut vastaanottajassaan, ja täl- 
lainen käännös voi vaatia suuriakin kulttuurisia muutoksia. Ekvivalenssi 
on käännöstieteen keskustelluimpia ja kiistellyimpiä käsitteitä, jota myös 
uudempi tutkimus on lähestynyt eri näkökulmista (ks. esim. Pym 2010). 

Käännöstieteen kehityksessä omaksi tieteenalaksi tärkeä tekijä oli 
James Holmesin (2000 [1972]) alun perin 1972 esittämä systemaatti- 
nen näkemys tieteenalasta nimeltä Translation Studies, sen rakenteesta 
ja osa-alueista (perusjakona descriptive translation studies ja theoretical 
translation studies tai käännösteoria, myöhemmin näistä ”puhtaan” 
käännöstieteen suunnista erotettiin applied translation studies). Merkit- 
tävää oli niin ikään painopisteen siirtyminen lähdeteksteistä käännök- 
siin; käännösorientoituneisuutta edustavat käännöstieteessä edelleenkin 
keskeiset suuntaukset: funktionaaliset käännösteoriat ja deskriptiivinen 
käännöstutkimus. 

1980-luvulla syntyneet funktionaaliset käännösteoriat, kuten Hans 
Vermeerin skopos-teoria (Reifg & Vermeer 1984) ja Justa Holz-Mänttärin 
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translatorisen toiminnan teoria (1984), korostavat kääntämistä tavoitteel- 
lisena toimintana, jossa ensisijaista on sen tarkoitus käännöksen vas- 
taanottaja mukaan lukien. Kääntäjä on ammattimainen toimija, joka ei 
vain koodaa uudelleen sanoja vaan tuottaa tekstejä kulttuurienväliseen 
viestintään kulloisenkin toimeksiannon ja tilanteen vaatimusten mu- 
kaisesti. Siten käännöksen laatimiseen vaikuttavat muutkin seikat kuin 
lähdeteksti, esimerkiksi kohdekulttuurin lait, normit ja konventiot. Lisäk- 
si translatoriseen toimintaan liittyy paljon muutakin kuin varsinainen 
kääntäminen: tiedonhankinta, tekstien tarkistus ja yhteistyö asiakkaiden 
ja muiden tekstin tuottajien kanssa. Tekstien multimodaalisuus, joka vas- 
ta myöhemmässä tutkimuksessa on tullut tärkeäksi huomioon otettavaksi 
näkökulmaksi, oli mukana jo Holz-Mänttärin teoriassa. Funktionalistit tu- 
livat kielitieteen piiristä, ja heidän tutkimuksensa kohdistuivat erityisesti 
erikoisalojen ja käyttötekstien kääntämiseen, vaikka esimerkiksi Vermeer 
halusi luoda yleisen käännösteorian, joka koskee kaikkea kääntämistä. 

Deskriptiivinen käännöstutkimus, jonka keskeisiä vaikuttajia oli 
Gideon Toury (1995), on puolestaan lähtöisin kirjallisuudentutkimuksen 
puolelta. Touryn kiinnostuksensa kohteena oli alun perin kirjallisuuden 
kääntäminen. Esimerkiksi polysysteemiteoria on kiinnostunut käännös- 
ten asemasta kohdekulttuurin kirjallisuuden systeemien verkostossa 
(Even-Zohar 1990). Deskriptiivisellä käännöstutkimuksella on merkittä- 
vä sija nykyisessä käännöstieteellisessä tutkimuksessa tekstilajeihin kat- 
somatta. Kun funktionalistit pyrkivät antamaan kriteereitä hyvälle kään- 
nökselle, deskriptiivisessä käännöstutkimuksessa tavoitteena on kuvata, 
millaisia käännökset ovat, ja selittää, miksi ne ovat sellaisia kuin ovat. 
Deskriptiivisen käännöstutkimuksen tutkimuskohteita ovat olleet muun 
muassa kääntämisen normit ja lainalaisuudet, ns. käännösuniversaalit 
(ks. tarkemmin luku 3.2.). 

1980-luvulta lähtien käännöstiede on nopeasti kehittynyt ja laajentu- 
nut. 2000-luvun merkittäviä suuntauksia on muun muassa kääntämi- 
sen sosiologia, joka kiinnittää huomion kääntäjään ja toimintaympäris- 
töön. Tutkimuskohteena on myös kääntämisen (ja tulkkauksen) historia. 
Kognitiivinen käännöstiede puolestaan tutkii käännösprosessia, sitä mitä 
kääntäjän päässä tapahtuu, kun hän kääntää. Viime aikojen sosiokognitii- 
vinen suuntaus, joka näkee kognition kehollisena ja tilannesidonnaisena, 
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tarkastelee käännösprosessin tutkimuksessa ”laajennettua kääntämistä” 
(engl. extended translation) ottaen huomioon kääntäjien teknologisen 
ja sosiaalisen työskentely-ympäristön, myös ergonomian (Risku, Rogl 
& Milosevic 2017). Teknologian kehityksen myötä omiksi ja kasvaviksi 
alueiksi ovat muodostuneet av-kääntämisen tutkimus ja käännöstekno- 
logia. Multimodaalisuuden kysymykset ja intersemioottinen kääntäminen 
ovat niin ikään kasvavia alueita. Nykyisissä monikielisissä yhteiskunnis- 
sa ylipäätään kysymys siitä, mikä tekee tekstistä käännöksen, mikä on 
lähdeteksti ja kuka on kääntäjä, ovat yhä monimutkaisempia, mikä vaatii 
tutkimukselta uusia lähestymistapoja, aineistoja ja menetelmiä. Käännös- 
tieteen alueellinen laajentuminen on nostanut esiin myös sen, että länsi- 
mainen käsitys käännöksistä ja kääntämisestä on yksipuolinen ja suppea. 


2.2. Tulkkauksen tutkimus 


Koska puhuttu kieli ja keskustelu ovat ensisijaisia vuorovaikutuksen 
keinoja, suullista tulkkausta on esiintynyt paljon ennen kirjallista kään- 
tämistä. Tulkkauksen systemaattinen tutkimus on kuitenkin alkanut 
myöhemmin kuin kääntämisen tutkimus. Tulkkauksen tutkimuksen 
yhtenä merkittävimpänä pioneerina on pidetty Danica Seleskovitchia, 
jonka ensimmäiset konferenssitulkkausta koskevat julkaisut ilmestyivät 
1960-luvulla. Hänen kehittämänsä tulkinnan teoria (ra. théorie du sens) 
näkee tulkkauksen sanoman ymmärtämisenä ja tulkitsemisena; erityi- 
sen tärkeää on tulkin yleistieto ja tieto tulkattavasta asiasta (Seleskovitch 
& Lederer 1989). Teoria nojautui psykologiaan ja poikkesi selvästi kään- 
tämisen puolella vallinneesta lingvistisestä lähestymistavasta, jossa sa- 
noja koodattiin uudelleen kielestä toiseen. 

Tulkkauksen tutkimuksen kohteena oli aluksi yksinomaan konfe- 
renssitulkkaus, ja ammatilliset ja koulutuskysymykset olivat keskeisiä. 
Tutkijat, kuten Seleskovitch, olivat itse konferenssitulkkeja. Pitkälti 
intuitioon perustuva tutkimus oli preskriptiivistä; siinä annettiin oh- 
jeita tulkkien toiminnalle. (Gile 2009.) Empiirinen ja kokeellinen tut- 
kimus alkoi 1990-luvulla. Kohteena oli edelleen konferenssitulkkaus, 
mutta tutkimukseen vaikuttivat keskeisesti kognitiivinen psykologia ja 
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neurotieteet sekä näitä lähellä olevat kielitieteen haarat psykolingvistiik- 
ka ja neurolingvistiikka (ks. Psyko- ja neurolingvistiikka tk.). Tutkijoita 
kiinnostivat erityisesti kognitiiviset kysymykset, kuten informaation pro- 


sessointi, kahdella kielellä tapahtuva puheen samanaikainen vastaan- 
ottaminen ja tuottaminen, ennakointi, muisti, kognitiivinen kuormitus, 
tulkkausstrategiat (Gile 1997) ja aivotoiminta (Tommola, Laine, Sunnari 
& Rinne 2000) (ks. myös Englund Dimitrova & Hyltenstam 2000). 

Käännöstutkimuksen puolella jalansijaa saaneet tekstintutkimus, 
funktionaaliset teoriat ja kohdetekstiorientoituneisuus vaikuttivat myös 
tulkkauksen tutkimuksessa. Pöchhacker (2004) on kutsunut näitä 
suuntauksia, joille yhteistä on kiinnostus tekstuaaliseen tuotteeseen, 
TT-paradigmaksi (engl. target-text-oriented translation-theoretical). Kon- 
ferenssitulkkauksesta tutkimus laajeni vähitellen dialogitulkkaukseen. 

Vasta 1990-luvun lopussa ja 2000-luvulla tutkimus kiinnostui sii- 
tä tulkkauksesta, joka tapahtuu kansallisessa kontekstissa erilaisissa 
sosiaalisissa tilanteissa, kuten asioimistulkkauksesta eli tulkkauksesta 
viranomaisasioinnissa ja terveydenhuollossa sekä oikeustulkkaukses- 
ta. Oikeustulkkauksen tutkimuksessa keskeisiä kysymyksiä ovat olleet 
muun muassa tarkkuus ja tulkin puolueettomuus. Kun sekä oikeus- 
että asioimistulkkauksessa kyse on vuorovaikutuksesta, tulkkivälittei- 
nen vuorovaikutus ja siihen liittyvät kysymykset, kuten tulkin rooli, 
ovat nousseet tutkimuksen keskiöön (mm. Wadensjö 1998, ks. myös 
luku 3.3.). (Tulkkauksen tutkimuksen historiasta ja painopisteistä ks. 
Pöchhacker 2004; Rouhe 2017.) 

Vaikka kääntämisen ja tulkkauksen tutkimuksen perinteet ja lähtö- 
kohdat eroavat, 1990-luvulta lähtien on myös etsitty yhteistä pohjaa. 
Saksalaisella kielialueella vaikutusvaltaiset funktionaaliset käännös- 
teoriat saivat tulkkauksen tutkimuksessa huomion kiinnittymään paitsi 
kokonaistilanteeseen ja toimintaan myös tekstilingvistisiin kysymyk- 
siin. Käännöstieteessä vaikuttava sosiologinen suunta näkyy myös tulk- 
kauksen tutkimuksessa; kohteena voi olla esimerkiksi tulkin status tai 
tulkkauksen historia. Deskriptiivisessä käännöstieteessä ja käännettyjen 
tekstien tutkimuksessa suosittu korpustutkimus on saanut jalansijaa 
myös tulkkauksen tutkimuksessa. Yhteisiä kysymyksiä ovat myös kou- 
lutukseen liittyvät ja ammatilliset kysymykset sekä laadun määrittely. 
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3. Käännöstieteen tutkimuskohteita, 
metodeja ja aineistoja 


3.1. Tekstintutkimus: käännökset ja tulkkeet 


Monen maan kirjallisuuden historia alkaa käännöskirjallisuudesta, 
ja käännöstieteellisen tutkimuksen historiallinen ydin on tekstin- 
tutkimusta. Käännettyjen tekstien osalta nykytutkimus koskee teksti- 
lajien koko kirjoa uskonnollisten tekstien käännöksistä käännettyihin 
verkkoteksteihin, kaunokirjallisuudesta käyttöohjeisiin, erikoisalojen 
teksteistä lastenkirjallisuuteen, laki- ja säädösteksteistä tv-tekstityksiin, 
tuotepakkausselostuksista dubbaukseen, tietokonepelien käännöksis- 
tä oopperatekstityksiin, laulujen sanoituksista sarjakuviin, käännetystä 
kielimaisemasta lääkepakkausteksteihin jne. Fi liene tekstilajia, jota ei 
olisi käännetty. Tutkijat ovat perinteisesti koostaneet omiin tutkimus- 
tarkoituksiinsa tarkastelemansa tekstilajin käännöksistä aineistoja ja 
analysoineet niitä manuaalisesti, ja nämä aineistonkeruu- ja analyysi- 
menetelmät ovat edelleen ajankohtaisia ja taajaan käytössä. Oman tutki- 
mussuuntauksensa muodostaa korpuslingvistinen käännettyjen tekstien 
tutkimus, jossa tutkittava tekstiaineisto on saatettu sähköiseen muotoon. 
Sähköisten korpusten tutkimusta esitellään erikseen seuraavassa luvussa 
3.2. Sähköisiä ja ei-sähköisiä aineistoja käytetään usein myös rinnakkain. 
Käännettyjä tekstejä ei tyypillisesti tutkita sellaisenaan, vaan tutkija 
valitsee jonkin yksittäispiirteen tai ilmiön ja tarkastelee sen esiintymistä 
käännetyissä teksteissä. Tekstilajista riippuen tutkimus voi kohdistua 
eri ilmiöihin; esimerkkeinä mainittakoon mm. erisnimien, kulttuuri- 
spesifisten ilmausten eli reaalioiden, varieteettien, monikielisyyden, 
sanaleikkien, tabusanojen, huumorin, tyylipiirteiden, kieliopin ilmiöi- 
den tai lähettäjä-vastaanottaja-konstellaatioiden kääntäminen. Käännös- 
tieteellinen tutkimus tuottaa paljon uutta tietoa näistä ilmiöistä, mutta 
varsinainen tavoite on sen kuvaaminen, mitä ikkunoita käännökset avaa- 
vat kääntämiseen, kääntäjän työhön tai kohdekulttuuriin. 
Menetelmällisesti ei-sähköisten tekstiaineistojen hyödyntäminen 
tarkoittaa ilmiöiden manuaalista poimintaa teksteistä, luokittelua ja 
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mahdollisesti myös muiden erilaisten analyysimenetelmien käyttöä 
(esim. lähiluku, diskurssianalyysi, keskustelunanalyysi, kategoria-analyysi, 
sisällönanalyysi, retoriikan ja tekstilingvistiikan teoriat, kieliopin erilaiset 
kuvausmallit jne.). Keskeinen menetelmä on vertailu: kääntäjän käännös- 
ratkaisuja vertaillaan tyypillisesti lähdetekstiin, toisenkielisiin käännöksiin 
tai aikaisemmin tai myöhemmin ilmestyneisiin samankielisiin käännök- 
siin. Julkaistut käännökset eivät heijastele vain kääntäjän ratkaisuja vaan 
myös kustannustoimittajan, kielentarkastajan tai muiden mahdollisten toi- 
mijoiden ”sormenjälkiä”. Mahdollista onkin vertailla julkaistua käännöstä 
myös julkaisemattomiin käännösversioihin ja tarkastajien kommentteihin. 
Vertailun menetelmiä kielentutkimuksen eri alueilla käsitellään kattavasti 
Kolehmaisen, Miestamon ja Nordlundin (2013) toimittamassa teoksessa. 
Vertailu lähdetekstiin mahdollistaa yhtäläisyyksien ja erojen paikan- 
tamisen, ja sen avulla on mahdollista kuvata käännösstrategioita, kään- 
täjän kohdekielisiä ratkaisuja lähdetekstin ilmiöihin. Käännösstrategiat 
heijastavat kääntämisessä ja kohdekulttuurissa kulloinkin vallitsevia 
arvoja, ideologioita ja normeja. Tutkimuksessa on esimerkiksi kysytty, 
miksi puhekielen piirteet, tietyt kerronnan keinot, kirosanat, uskonnol- 
liset tai poliittiset viittaukset ja seksuaalisten vähemmistöjen esittämi- 
nen saattavat kadota tai muuttua käännöksissä. (Suomalaisesta kään- 
tämisen normien ja ideologioiden tutkimuksesta ks. esim. Koskinen 
& Paloposki 2015; Kujamäki 1998; Kuusi 2011; Tiittula & Nuolijärvi 
2013.) Käännösversioiden keskinäinen vertailu taas avaa näkökulmia 
kääntäjän työskentelyyn ja käännösprosessiin, ja opiskelijakäännösten 
vertailu ammattilaisten tuotoksiin tuo tietoa kääntäjäkompetenssin ke- 
hittymisestä sekä sen luonteesta (ks. luku 3.3.). Multimodaalisten lähde- 
tekstien vertailu niiden käännöksiin tuo tietoa kääntäjän työstä, siitä, 
miten kielen ulkopuoliset seikat, kuten kuvan tai äänen ja sanan suhde, 
vaikuttavat käännettyyn lopputulokseen esimerkiksi lasten kuvakirjo- 
jen, verkkotekstien tai tv-sarjojen ja elokuvien käännöksissä. Käännet- 
tyjä tekstejä on vertailtu lähdeteksteihin myös laadun näkökulmasta. 
Ajankohtainen tutkimus korostaa kuitenkin, että laatu ei ole ainoastaan 
käännöksen vaan myös käännösprosessin ominaisuus. Se, millaisin 
reunaehdoin, millaisissa ympäristöissä ja tuotantoketjuissa käännöksiä 
tuotetaan, vaikuttaa käännöksen laatuun (ks. esim. Abdallah 2012). 
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Käännöstieteellinen tekstintutkimus voi kohdistua myös teksteihin, 
jotka eivät ole käännöksiä. Tällaisia tekstejä ovat esimerkiksi käännöksiä 
ja kääntämistä kommentoivat paratekstit: ne ovat joko teoksen yhteydessä 
esiintyviä teosta kommentoivia tekstejä (esim. otsikko, esipuhe, jälkisanat, 
viitteet) tai teosta siitä erillään kommentoivia tekstejä (esim. päiväkirja- 
merkinnät, kirja-arviot, kirjeenvaihto, haastattelut). Niiden avulla on tut- 
kittu esimerkiksi kääntämisen ideologiaa, käännösprosessia sekä kääntä- 
jien verkostoja ja toimintaa (ks. esim. Kemppanen 2011; Paloposki 2007). 

Tulkkausaineistojen luonne poikkeaa osin käännetyistä aineistoista. 
Suullinen tulkkaus on tyypillisesti ainutkertainen tilanne, jossa syntyvään 
tulkkeeseen tulkin ei ole mahdollista palata: tulketta ei voi jälkikäteen hioa, 
korjata tai muokata. Tulkkauksen tutkimuksessa tulke toimiikin tutkijal- 
le usein ikkunana tulkkausprosessin kognitiiviseen, psykolingvistiseen 
ja sosiaaliseen ulottuvuuteen: tulkin muistiin, tulkkauksen kuormitta- 
vuustekijöihin sekä tulkin toimintaan välittäjänä eri osapuolia sisältävissä 
tilanteissa. Tulkeaineistoja on taltioitu erilaisista aidoista tulkkaustilan- 
teista tulkkauslajeittain (simultaani-, konsekutiivi-, konferenssi-, oikeus-, 
asioimistulkkaus jne.) mutta myös tutkimusta varten järjestetyistä kokeel- 
lisista tulkkaustilanteista ja tulkkiopiskelijoiden oppimistilanteista. 

Tulkkauksessa analyysi on kohdistunut lähdekielisen puheen ominai- 
suuksiin sekä siihen, kuinka lähdepuhe vaikuttaa tulkkeeseen (kielten- 
väliset erot, puheen ja puhujien piirteet). Tutkijat ovat tarkastelleet esi- 
merkiksi tulkkeessa esiintyviä toistoja, korjauksia, lisäyksiä, poistoja, 
viiveitä ja taukoja sekä niiden syitä. Tutkittujen piirteiden avulla on lä- 
hestytty esimerkiksi tulkkausstrategioita, tulkkauksen laatua, tarkkuutta 
ja sujuvuutta, tulkkausprosessia, tulkin roolia ja teknisten ratkaisujen 
vaikutusta (esim. etätulkkauksessa). (Suomalaisesta tutkimuksesta ks. 
esim. Isolahti 2014; Rouhe 2017; Vik-Tuovinen 2006; Vuorikoski 2004; 
tulkkauksen tutkimuksesta ks. myös luku 3.3.) 

Sekä käännökset että tulkkeet ovat vain yksi osa käännös- tai tulkkaus- 
prosessia. Molempiin prosesseihin vaikuttavat esimerkiksi toimeksi- 
anto, vuorovaikutustilanne, valmistautuminen ja toimijoiden etukäteen 
saama valmistautumismateriaali. Koko kääntämis- tai tulkkausprosessi 
ei siten ole tutkijan saavutettavissa pelkän käännöksen tai tulkkeen ana- 
lyysin avulla. 
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3.2. Korpuslingvistinen käännösten ja tulkkeiden tutkimus 


Edellisessä luvussa havainnollistetut käännöksiä tai tulkkeita sisältävät 
aineistot on mahdollista saattaa sähköiseen muotoon, jolloin niitä voi 
analysoida erilaisten automaattisten työkalujen ja ohjelmien avulla. Suu- 
ria sähköisiä kirjoitetun tai puhutun kielen aineistoja kutsutaan yleensä 
korpuksiksi (ks. Korpusaineistot tk.). Kuva 1 havainnollistaa käännös- 
tieteellisen tutkimuksen tärkeimpiä korpustyyppejä. Keskeiset termit, 
rinnakkaiskorpus (engl. parallel corpus) ja sen synonyyminä esiintyvä 
käännöskorpus (engl. translation corpus) sekä verrannollinen korpus (engl. 
comparable corpus), ovat pitkälti vakiintuneet, mutta on syytä olla tie- 
toinen siitä, että termien käyttö ja merkitys vaihtelevat eri tutkijoiden 
kesken. Havainnollistamme seuraavassa näitä aineistoja ja niiden avulla 
tutkittuja kysymyksiä. 


Käännöstieteellisen 
tutkimuksen 


korpustyyppejä 


Rinnakkaiskorpus: Verrannollinen korpus: 
lähdetekstit ja niiden käännetyt tekstit ja 
käännökset samankieliset ei-käännetyt 
(käännöskorpus) tekstit 


Yksisuuntainen A — B 


Kaksisuuntainen A > B 
ja B—> A 


Kuva 1. Käännöstieteellisen tutkimuksen keskeiset korpustyypit. 
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Rinnakkaiskorpuksilla eli käännöskorpuksilla tarkoitetaan yleensä kaksi- 
tai monikielisiä korpuksia, jotka koostuvat yhden kielen lähdeteksteis- 
tä ja niiden käännöksistä yhteen tai useampaan kieleen. Mahdollisesti 
mukana voi olla saman lähdetekstin useampia käännöksiä samaan tai 
eri kieliin. Rinnakkaiskorpus voi olla yksisuuntainen ja sisältää kään- 
nöksiä vain yhteen suuntaan tai kaksisuuntainen, jolloin mukana on 
käännöksiä kielestä A kieleen B ja kielestä B kieleen A. Kaksisuuntais- 
ten rinnakkaiskorpusten pioneerina pidetään usein englanti-norja- 
rinnakkaiskorpusta' (Johansson 2007). Se koostuu englanninkielisistä 
lähdeteksteistä ja niiden norjannoksista sekä norjankielisistä lähdeteks- 
teistä ja niiden englanninnoksista. Korpus mahdollistaa siten kielten- 
välisen vertailun keskenään rinnakkaisten tekstien välillä (lähdetekstien 
vertailu käännöksiin) molemmissa suunnissa (englanti-norja, norja— 
englanti) ja keskenään verrannollisten tekstien välillä (englanninkieliset 
vs. norjankieliset alkuperäistekstit, englanninkieliset vs. norjankieliset 
käännökset). Lisämahdollisuutena on yksikielinen alkuperäistekstien 
vertailu samankielisiin käännöksiin (englanninkieliset alkuperäistekstit 
vs. käännökset, norjankieliset alkuperäistekstit vs. käännökset). 
Verrannolliset korpukset puolestaan koostuvat teksteistä, jotka ei- 
vät ole toistensa käännöksiä mutta ovat jollakin muulla tapaa vertailu- 
kelpoisia keskenään, esimerkiksi tekstilajiltaan. Käännöstieteessä 
verrannollisia korpuksia voidaan pitää 1990-luvulla alkaneen korpus- 
lingvistisen "buumin" yhtenä laukaisijana. Idea verrannollisista kor- 
puksista palautuu Bakerin (1993; 1996) artikkeleihin, joissa esiteltiin 
kokonaan uudenlainen aineistoasetelma: edellä esitellyn rinnakkais- 
korpusten mahdollistaman lähdetekstien ja niiden käännösten vertailun 
sijaan käännettyjä tekstejä olisikin mahdollista vertailla myös saman- 
kielisiin ei-käännettyihin teksteihin. Verrannollisten korpusten tutki- 
muksessa alettiin keskittyä enemmän kohdeteksteihin, kun aiemmin 
keskityttiin lähdeteksteihin. Tunnettuja verrannollisia korpuksia ovat 
esimerkiksi Translational English Corpus? (Laviosa 1996), joka sisältää 
eri kielistä englantiin käännettyjä ja verrannollisia ei-käännettyjä englan- 
ninkielisiä tekstejä, ja Käännössuomen korpus (Mauranen 2000), joka 
koostuu eri kielistä suomeen käännetyistä ja ei-käännetyistä, ns. supi- 
suomen teksteistä. Suomalainen YLE-korpus, joka lienee edelleenkin 
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maailman suurin ruututekstikorpus, lukeutuu verrannollisiin korpuk- 
siin. Se sisältää Ylen vuosina 1992-2004 lähettämien tv-ohjelmien eri 
kielistä käännetyt tekstitykset ja kuulovammaisille katsojille suunnatut 
ei-käännetyt ohjelmatekstitykset3 Tiedemannin Opus on rinnakkais- 
korpus, joka käsittää internetistä kerättyjä käännöstekstejä, myös elo- 
kuvien ja tv-ohjelmien tekstityksiä. 

Korpuslingvistiset tutkimukset ovat pitkälti keskittyneet mahdollis- 
ten kääntämisen universaalien selvittämiseen. Hypoteesi kääntämisen 
universaaleista, kielellisistä piirteistä, jotka esiintyvät kieliparista riip- 
pumatta pikemminkin käännetyissä teksteissä kuin ei-käännetyissä ja 
joita kääntäminen erityisenä kielentuottamisprosessinaan aiheuttaa 
kohdeteksteihin, palautuu Bakerin (1993; 1996) julkaisuihin. Kääntä- 
misen universaaleja tai lakeja, jotka erottavat käännöksiä samankielisistä 
ei-käännetyistä teksteistä (Toury 1995), on tutkittu korpuksissa tarkas- 
telemalla esimerkiksi sana- ja sanemääriä ja leksikaalista variaatiota, 
mittaamalla lause- ja virkepituuksia, tutkimalla kollokaatioita (eli mitkä 
sanat esiintyvät tyypillisesti yhdessä) tai analysoimalla lukuisten eri- 
laisten kielen yksiköiden, kuten pronominien, konjunktioiden, fraseo- 
logismien tai kieliopillisten rakenteiden, käyttöympäristöjä, funktioita 
ja esiintymistiheyksiä. 

Kääntämisen universaaleiksi on ehdotettu mm. käännösten kielel- 
listä eksplisiittistymistä (tendenssi lisätä käännetyn tekstin eksplisiitti- 
syyttä esim. koheesiokytkennöillä ja selityksillä), yksinkertaistumista ja 
normaalistumista (viimeisintä kutsutaan vaihtoehtoisesti myös konven- 
tionaalistumiseksi, standardisoitumiseksi tai tasaantumiseksi). Kollo- 
kaatioiden on havaittu olevan epätyypillisiä käännöksissä, ja kielellisten 
yksiköiden frekvenssien on huomattu olevan poikkeuksellisia. Esimer- 
kiksi kieliparikohtaiset kohdekielen ns. vastineettomat ainekset näyttä- 
vät olevan harvinaisempia kuin ei-käännetyissä teksteissä tai puuttuvan 
kokonaan.5 

Kääntämisen universaalien tutkimuksessa rinnakkaiskorpusten käyt- 
tö on jatkunut verrannollisten korpusten rinnalla. Tämä on aiheuttanut 
joskus käsitteellistä sekaannusta, ja aina ei ole täysin selvää, mitä tutkijat 
täsmälleen tarkoittavat. Chestermanin (2004) erottelu S- ja T-univer- 
saalien välille onkin selkiyttänyt keskustelua: S-universaalit (S = source) 
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viittaavat käännettyjen tekstien piirteisiin verrattuna niiden lähdeteks- 
teihin. T-universaalit (T = target) taas tarkoittavat systemaattisia eroja 
kohdekielisten käännösten ja samankielisten ei-käännettyjen tekstien 
välillä. Kääntämisen universaalihypoteeseja on myös kritisoitu, ja kai- 
kille ehdotetuille hypoteeseille on löydetty vastaesimerkkejä korpuksis- 
ta, muita selityksiä tai vasta-argumentteja kääntämisen historiasta (ks. 
esim. Becher 2011; Kuusi 2016; Tiittula & Nuolijärvi 2016). 

Kääntämisen universaalien tutkimuksessa tavoitteena oli alun perin 
selvittää, mikä on käännetyille teksteille yhteistä lähdekielestä riippu- 
matta ja mitä piirteitä kääntäminen omana erityisenä kielen tuottamis- 
prosessinaan aiheuttaa. Mukana tarkastelussa on ollut kuitenkin alusta 
asti myös kysymys kieliparikohtaisista tai kieltenvälisistä typologisista 
eroista ja niiden vaikutuksesta käännettyjen tekstien kielellisiin piirtei- 
siin (ks. esim. Cappelle & Loock 2017), interferenssistä eli lähdekieli- tai 
lähdetekstispesifisestä kontaktivaikutuksesta käännettyihin teksteihin 
(ks. esim. Mauranen 2004) sekä käännössuunnan vaikutuksesta (ks. 
esim. Evert & Neumann 2017). Tutkijat ovat myös kysyneet, mikä on 
tekstilajikohtaista, mikä kääntämiselle universaalia tekstilajista riippu- 
matta (ks. esim. Delaere & De Sutter 2017). Lisäksi korpustutkijat ovat 
nostaneet esille muiden mahdollisten toimijoiden käännöksiin jättämät 
jäljet — kääntäminen on sosiaalinen tapahtuma, jossa lopputulokseen 
vaikuttavat kääntäjien lisäksi kustannustoimittajat, editoijat ja kielen- 
tarkastajat. Korpuksiin taltioidut käännetyt tekstit eivät siten välttämät- 
tä kerro vain kääntäjän ratkaisuista. (Kruger 2017.) Vaihtelua aiheuttaa 
myös se, kenen käännöksestä on kyse. Kääntäminen voi tapahtua kään- 
täjän äidinkieleen tai vieraaseen kieleen — ja aina ei ole edes selvää, onko 
kyse äidinkielestä vai vieraasta kielestä (ks. esim. Pokorn 2005). Yh- 
teenvetona kääntämisen universaalipiirteiden tutkimuksesta voi todeta, 
että nykykorpustutkimuksen valossa käännettyjen tekstien mahdolliset 
erityisyydet näyttäytyvät monimutkaisina piirteiden kimppuina, jotka 
voivat johtua useasta samanaikaisesti vaikuttavasta tekijästä, ei pelkäs- 
tään käännösprosessista. 

Korpusten avulla on tutkittu myös tekstien ideologiaa: keskeisenä me- 
netelmänä tässä tutkimuksessa on ollut avainsana-analyysi. Avainsanalla 
tarkoitetaan kielenainesta, jonka esiintymistiheys aineistossa poikkeaa 
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tilastollisesti merkitsevästi vertailuaineistosta. Poikkeuksellinen esiinty- 
mistiheys kertoo esimerkiksi käännettyjen tekstien näkökulmapiirteistä 
ja diskursiivisista erityispiirteistä tai eroista vertailuaineistoihin verrat- 
tuna (ks. esim. Kemppanen 2008; Probirskaja 2009; Laviosa, Pagano, 
Kemppanen & Ji 2017). Automaattisten korpuslingvististen menetel- 
mien rinnalla tutkijat hyödyntävät usein tilastollisia menetelmiä (ks. 
Määrällinen korpuslingvistiikka tk.). 


Kielenoppimisen tutkimuksessa koostettuihin oppijankielen korpuk- 
siin taas rinnastuvat käännöstieteilijöiden opiskelijakäännöskorpukset, 
joita esitellään esimerkiksi Castagnolin, Ciobanun, Kunzin, Kiblerin ja 
Volanschin (2011) artikkelissa. Alan terminologia ei ole vielä vakiintunut 
vaan vaihtelee (engl. translation learner corpus, learner translator corpus, 
student translation corpus). Opiskelijakäännöskorpusten avulla on mah- 
dollista tutkia esimerkiksi opiskelijoiden käännöskompetenssia ja sen 
kehittymistä ja vertailla sitä ammattikääntäjien kompetenssiin (ks. esim. 
Englund Dimitrova 2005). 

Sähköiset tulkkauskorpukset on mahdollista jakaa samalla taval- 
la lähdetekstejä ja niiden tulkkeita sisältäviin kaksi- tai monikielisiin 
rinnakkaiskorpuksiin sekä verrannollisiin tulkkausta ja samankielistä 
ei-tulkattua vuorovaikutusta sisältäviin korpuksiin (ks. esim. Bendazzoli 
2015; Bendazzoli 2018; Bernardini, Ferraresi, Russo, Collard & Defrancg 
2018; Shlesinger 1998). Shlesinger (1998, 3) korostaa, että ideaalitilan- 
teessa molemmat tulkkauskorpukset sisältävät lisäksi kohdekielen kään- 
nettyjä tekstejä. Tällainen korpuskonstellaatio mahdollistaa sen tunnis- 
tamisen, mikä on nimenomaan tulkkaukselle tyypillistä ja erottaa sitä 
kääntämisestä. Tulkkauskorpukset eivät ole kehittyneet samaan tahtiin 
kirjoitetun kielen käännöksiä sisältävien korpusten kanssa, niitä ei ole 
saatavilla yhtä paljon, eivätkä ne ole yhtä suuria. Syy on ilmeinen: suul- 
lisen vuorovaikutuksen video- tai äänitaltioiminen, puheen litterointi 
ja paralingvististen keinojen merkintä litteraattiin on työläämpää kuin 
kirjoitettujen tekstien työstäminen. 

Tulkkausmenetelmä ja -tilanne ovat keskeisimmät seikat, jotka vai- 
kuttavat tulkkaukseen. Tästä syystä tulkkauskorpukset edustavat usein 
kulloinkin vain yhtä tai muutamaa tulkkausmenetelmää ja -tilannet- 
ta. Esimerkkeinä olemassa olevista sähköisistä tulkkauskorpuksista 
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mainittakoon Euroopan parlamentin kokousten englanti-italia-espanja- 
simultaanitulkkauskorpus EPIC (The European Parliament Interpreting 
Corpus)* (Monti, Bendazzoli, Sandrelli & Russo 2005), monikielinen 
ComInDat (Community Interpreting Database)’, joka sisältää sekä 
lääkäri-potilas-asioimistulkkausta että oikeustulkkausta (Angermeyer, 
Meyer & Schmidt 2012), ja englanti-italia-simultaanitulkkauskor- 
pus FOOTIE (Football in Europe) jalkapallon lehdistökonferensseista 
(Sandrelli 2012). 


Käännösten korpuslingvistiseen tutkimukseen on saatavilla lukuisia 
johdanto- ja kokoomateoksia. 


Ajankohtaisia johdantoteoksia käännöstieteellisten korpusten kokoami- 
sesta, annotoinnista ja korpuslingvistisestä analyysista: 


Mikhailov, Mikhail & Cooper, Robert. 2016. Corpus Linguistics for 
Translation and Contrastive Studies: A Guide for Research. Abingdon: Taylor 
& Francis. 


Zanettin, Federico. 2012. Translation-Driven Corpora: Corpus Resources 
for Descriptive and Applied Translation Studies. Manchester: St. Jerome. 


Ajankohtaisia kokoomateoksia käännösten korpuslingvistisesta tutki- 
muksesta: 


Delaere, Isabelle, Lefer, Marie-Aude & De Sutter, Gert (toim.). 2017. 
Empirical Translation Studies: New Methodological and Theoretical 
Traditions. Berlin: De Gruyter Mouton. 


Hansen-Schirra, Silvia, Neumann, Stella & Steiner, Erich (toim.). 2012. 
Cross-Linguistic Corpora for the Study of Translations. Insights from the 
Language Pair English-German. Berlin: De Gruyter Mouton. 


Ji, Meng (toim.). 2016. Empirical Translation Studies: Interdisciplinary 
Methodologies Explored. Sheffield: Eguinox. 
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Ji, Meng, Hareide, Lidun, Li, Defeng & Oakes, Michael (toim.). 2017. 
Corpus Methodologies Explained: An Empirical Approach to Translation 
Studies. London: Routledge. 


Kruger, Alet, Wallmach, Kim & Munday, Jeremy (toim.). 2013. 
Corpus-based Translation Studies: Research and Applications. London: 


Continuum. 


Laviosa, Sara, Pagano, Adriana, Kemppanen, Hannu & Ji, Meng. 2017. 
Textual and Contextual Analysis in Empirical Translation Studies. Singapore: 
Springer. 


Oakes, Michael P. & Ji, Meng (toim.). 2012. Quantitative Methods 
in Corpus-based Translation Studies: A Practical Guide to Descriptive 
Translation Research. Amsterdam: John Benjamins. 


Katsauksia korpuslingvistiseen tulkkaustutkimukseen ja ajankohtaista 
tutkimusta: 


Bendazzoli, Claudio. 2015. Corpus-based research. Julkaisussa: 
Péchhacker, Franz (toim.) Routledge Encyclopedia of Interpreting Studies. 
Florence: Taylor & Francis, 132-135. 


Russo, Mariachiara, Bendazzoli, Claudio & Defrancg, Bart (toim.). 2018. 
Making Way in Corpus-based Interpreting Studies. Singapore: Springer. 


Setton, Robin. 2011. Corpus-based interpreting studies (CIS). Julkaisus- 
sa: Kruger, Alet, Wallmach, Kim & Munday, Jeremy (toim.) Corpus-based 
Translation Studies: Research and Applications. London: Continuum, 33-75. 


Shlesinger, Miriam. 1998. Corpus-based interpreting studies as an off- 
shoot of corpus-based translation studies. Meta XLIII: 4, 1-8. Saatavissa: 
http: //citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.9115&re- 
p=rep1&type=pdf. 


Straniero Sergio, Francesco & Falbo, Caterina (toim.). 2012. Breaking 
Ground in Corpus-based Interpreting Studies. Bern: Peter Lang. 


LUKU 23 KÄÄNNÖSTIEDE JA SEN MENETELMÄT 961 


3.3. Prosessin tutkimus 


Käännöstutkimuksessa painopiste on pitkälti ollut lopputuotteessa, 
käännöksissä, vaikka prosessi vaikuttaa olennaisesti käännöksen laa- 
tuun. Suuri osa tulkkauksen tutkimusta taas on ollut nimenomaan 
prosessin tutkimusta (vrt. luku 2.2.). Koska kirjallinen kääntäminen ja 
suullinen tulkkaus ovat erilaista toimintaa, myös niiden prosessien tut- 
kimuksessa on eroja. Seuraavassa painopiste on aluksi kognitiivisessa 
prosessin tutkimuksessa ja erityisesti kääntämisessä, mutta otamme 
soveltuvissa kohdin myös tulkkauksen huomioon. Luvun lopussa on 
lyhyt katsaus tulkkauksen tutkimuksessa käytetyistä menetelmistä. 
Prosessin tutkimuksen keskeisenä tavoitteena on pidetty kääntämi- 
sen kognitiivisten prosessien ymmärtämistä painopisteen ollessa yk- 
sittäisessä kääntäjässä. Sekä kääntämisen että tulkkauksen prosessi on 
tavallisesti jaettu kolmeen vaiheeseen: lähdetekstin ymmärtämiseen, 
kahden kielen välillä tapahtuvaan siirtoon ja kohdetekstin tuottamiseen. 
(Englund Dimitrova 2016.) Prosessia voidaan kuitenkin tarkastella laa- 
jemmin, ja esimerkiksi Mufioz Martin (2010) erottaa käännösprosessis- 
sa kolme tasoa: Ensimmäinen taso käsittää käännösprosessin aikaiset 
mentaaliset tilat ja operaatiot. Toinen, ensimmäiseen kiinteästi liittyvä 
taso käsittää kääntämisen osatehtävät, kuten lukemisen, kirjoittamisen, 
tiedonhankinnan ja oikoluvun. Kolmas taso viittaa käännösprosessin 
tilanteisuuteen ja sisältää kaiken käännöstoimeksiantoon ja käännök- 
seen liittyvän toiminnan ja kaikki mukana olevat toimijat alkaen toi- 
meksiantajan kontaktista ja päättyen lopullisen käännöksen vastaan- 
ottoon (vrt. Holz-Mänttärin 1984 translatorisen toiminnan malli). Tällä 
tasolla käännösprosessiin kuuluvat niin yhteistyö eri toimijoiden kanssa 
kuin monet ammattikääntämiseen liittyvät lisätehtävät, kuten projektin- 
hallinta tai laskutus. Tarkastelemme tässä luvussa kahta ensimmäistä 
tasoa ja niitä tutkivaa kognitiivista suuntausta eli käännösprosessia sup- 
peammassa mielessä. Kolmatta tasoa, joka laajentaa näkökulman eri 
toimijoihin ja toimintaympäristöön, käsittelemme seuraavassa luvussa. 
Kognitiivisessa käännösprosessin tutkimuksessa huomio on koh- 
distunut muun muassa ongelmanratkaisuun ja päätöksentekoon sekä 
käännösstrategioihin. Keskeisiä kysymyksiä ovat niin ikään kompetenssi 
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ja asiantuntijuus sekä niiden kehittyminen, esimerkiksi miten ammatti- 
kääntäjän toiminta eroaa kokemattoman kääntäjän toiminnasta tai mi- 
ten kompetenssia voidaan mallintaa. Koska kääntäminen on aina sidok- 
sissa sosiaaliseen kontekstiin, prosessin tutkimuksessa pyritään myös 
ymmärtämään sen vaikutusta. (Saldanha & O'Brien 2013, 109.) 

Varhaisimpia tutkimusmenetelmiä on introspektio, kääntäjän sanalli- 
nen raportti omasta prosessistaan. Raportti voi olla suullinen tai kirjalli- 
nen, ja se voidaan tuottaa tehtävää suoritettaessa tai sen jälkeen. Esimer- 
kiksi kääntäjä voi pitää päiväkirjaa prosessin aikana tai hän voi kertoa 
prosessistaan käännöksen jälkeen. Jälkeenpäin tapahtuvaa retrospektiota 
voidaan käyttää myös tulkkauksen tutkimuksessa (esim. Vik-Tuovinen 
2006; retrospektiosta käännösprosessin tutkimuksessa ks. Hansen 
2006). Kognitiivisesta psykologiasta lainattu ääneen ajattelun menetel- 
mä oli pitkään keskeinen kognitiivisen käännöstutkimuksen menetel- 
mä. Siinä tehtävän suorittajaa pyydetään verbalisoimaan kaikki ajatuk- 
sensa tehtävän aikana ja puhe litteroidaan ”ääneenajatteluprotokollaksi” 
(think-aloud protocol, TAP). Göpferich, Bayer-Hohenwarter, Prassl 
ja Stadlober (2011) ovat ehdottaneet menetelmän nimeksi käännös- 
prosessiprotokollaa (translation process protocol, TPP) osoittamaan sitä, 
että protokolla ei sisällä vain kääntämisen aikaista puhetta vaan myös 
toimintaa prosessin aikana, kuten tiedonhakua. 

Menetelmällä on tutkittu kääntäjien ongelmanratkaisua ja eri ryh- 
mien välisiä eroja, kuten kokeneiden kääntäjien ja opiskelijoiden 
käännösprosessien eroja (esim. Jääskeläinen 1999). Menetelmää on 
kritisoitu siitä, että ääneen ajattelu häiritsee käännöstyötä eikä ole 
luonnollista. Lisäksi kaikki toiminnot, erityisesti automatisoituneet ja 
heikosti tiedostetut, eivät ole verbalisoitavissa. Rinnalle on esitetty pari- 
työskentelyssä syntyvää dialogista protokollaa (Kussmaul 1995). Tällöin 
yhdessä työskentelevät kääntäjät keskustelevat käännösongelmista ja nii- 
den ratkaisuista, ja nauhoitettu keskustelu analysoidaan (mm. Pavlović 
2013). On huomattava, että TAP ja dialoginen protokolla paitsi ovat eri 
menetelmiä myös kuvaavat erilaisia prosesseja (Jääskeläinen 2011b, 19). 

Ääneen ajattelu -metodin rinnalle on tullut muita menetelmiä 
työkalujen kehittyessä. Tietokoneen näppäintoimintojen tallennus- 
ohjelmalla saadaan talteen kaikki käännösprosessin aikana tapahtuvat 
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kirjoitustoiminnot mukaan lukien hiiren liikkeet, tauot ja poistot. Näin 
voidaan tarkastella esimerkiksi sitä, miten kääntäjä jaksottaa kääntä- 
mistä sekä editoi ja korjaa tuotostaan. Käännöstieteellisessä tutkimuk- 
sessa on käytetty erityisesti Translog-ohjelmaa. Esimerkiksi tekstin 
segmentointia tutkittaessa on havaittu, että kokeneet kääntäjät proses- 
soivat laajempia yksiköitä kuin kokemattomat (Jakobsen 2003; Englund 
Dimitrova 2005). Taukoja analysoimalla voidaan myös tutkia kääntäjän 
tai post-editoijan kognitiivista kuormitusta (O'Brien 2006). Myös kuva- 
ruuduntallennusohjelma, joka tallentaa tietokoneen näytön tapahtumat, 
mahdollistaa kirjoitusprosessin yksityiskohtaisen tutkimisen. Lisäksi tal- 
lennetuiksi tulevat sähköiset tiedonhaut, esimerkiksi elektronisten sana- 
kirjojen käyttö. Kumpulainen (2016) on tutkinut menetelmän avulla 
kääntäjäopiskelijoiden käännösprosessia, kuten käännösyksikön pituut- 
ta, korjauksia ja tiedonhakua. Hänen pitkittäistutkimuksensa kohteena 
on käännöskompetenssin kehittyminen. 

Silmänliike- eli katseenseurantatutkimuksen avulla voidaan tutkia 
kääntäjän ja tulkin kognitiivista suoritusta ja kuormitusta prosessin ai- 
kana. Esimerkiksi Jakobsen ja Jensen (2008) tutkivat sitä, miten lähde- 
tekstin lukeminen eroaa sen mukaan, onko tarkoituksena tavallinen 
tekstin ymmärtäminen vai valmistautuminen tekstin kääntämiseen ja 
käännetäänkö suullisesti (prima vista -kääntäminen) vai kirjallisesti. 
Koglin (2015) puolestaan vertaili kognitiivista kuormitusta metaforien 
kääntämisessä ja niiden konekäännösten post-editoinnissa. Silmänliike- 
tutkimusta voidaan soveltaa myös vaikkapa kuvailutulkkauksen tutki- 
muksessa sen selvittämiseen, miten näkevä tulkki identifioi ja erottaa 
kokonaisuudesta salientin informaation, joka on olennainen auditiivisen 
kertomuksen rakentamisessa sokealle vastaanottajalle (Kruger 2012). 

Käännösprosessin tutkimuksessa korostetaan nykyään triangulaatiota 
(ks. Johdannon luku 1 tk.): koska kyse on kompleksisista prosesseis- 


ta, niiden ymmärtäminen vaatii eri menetelmien yhdistämistä. Moni- 
menetelmäisyys mahdollistaa myös uudenlaisia tutkimuskysymyksiä, 
kun aiemmin tutkimus uusien työkalujen sovelluksessa on ollut enem- 
män metodilähtöistä. Esimerkiksi yhdistämällä silmänliike- ja näppäin- 
toimintojen tutkimusta on päästy tarkastelemaan käännösprosessin kes- 
keisten osien, lähdetekstin ymmärtämisen ja kohdetekstin tuottamisen, 
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suhdetta (Dragsted 2010). Erityisesti käännöskompetenssin tutkimuk- 
sessa ja mallintamisessa monimenetelmäisyys on tavallista, ja prosessin 
tutkimukseen yhdistetään myös lopputulosten eli lopullisten käännös- 
ten analyysi (esim. Englund Dimitrova 2005; Göpferich ja muut 2011; 
Kumpulainen 2016; PACTE Group 2011). 

Samalla kun kognitiivisen käännösprosessin tutkimuksen kohteet 
ovat laajentuneet, esiin ovat nousseet yhä enemmän metodiset kysymyk- 
set, toisin sanoen kysymykset siitä, miten prosessia ylipäätään voidaan 
tutkia. Myös tutkimusasetelmaan on kiinnitetty tarkempaa huomiota, 
esimerkiksi tutkittavien valintaan ja luokitteluun (miten esim. määritel- 
lään ammattikääntäjä). Tutkimus on usein monitieteistä, ja erityisesti 
kognitiotieteen ja tietojenkäsittelytieteiden asiantuntemus on tarpeen. 
(Kognitiivisesta käännöstutkimuksesta tarkemmin ks. esim. Shreve & 
Angelone 2010; Risku 2012.) 

Prosessin tutkimus on usein myös kokeellista. Gilen (2015) mukaan 
kokeelliset menetelmät sopivat hyvin käännös- ja tulkkaustutkimuk- 
seen, koska kääntämiseen ja tulkkaukseen vaikuttavat aina monet teki- 
jät ja niitä sekä kääntämisen ja tulkkauksen ympäristöä on mahdollista 
kontrolloida ja muunnella ja tuotos on helposti määriteltävissä. Usein 
tutkimus on eksploratiivista (vähän tutkittua aluetta kartoittavaa, pilotti- 
tutkimusta) tai kvasikokeellista (kaikkia muuttujia ei kontrolloida tai 
manipuloida). Koeasetelmissa voidaan tutkia esimerkiksi käännössuun- 
nan vaikutusta prosessiin. Tulkkauksen puolella suuri osa simultaani- 
tulkkauksen tutkimuksesta on ollut kokeellista ja hypoteesien testausta, 
ja tutkimus on kohdistunut muun muassa muistiin, kielen prosessoin- 
tiin ja kognitiivisen kuormituksen vaikutuksiin (Hale & Napier 2013). 

Kokeellisen tutkimuksen ongelma on, että tilanne ei useinkaan ole 
aito — paitsi ehkä opiskelijoille, joita onkin usein käytetty tutkimuksis- 
sa. Esimerkiksi tutkija valikoi käännettävän tekstin, joka voi ammatti- 
kääntäjän näkökulmasta olla epäolennainen. Jos tehtävä ei ole aito, am- 
mattikääntäjiä on vaikea motivoida paneutumaan kääntämiseen niin 
kuin he työskentelisivät aidossa toimeksiannossa. Käännösprosessin 
tutkimuksessa kiinnitetäänkin yhä enemmän huomiota ekologiseen 
validiteettiin eli siihen, että koetilanne vastaa tutkittavaa todellisuutta ja 
kokeen tulokset ovat yleistettävissä tositilanteisiin. Myös etnografisten 
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menetelmien avulla pyritään parantamaan tähänastisen prosessitutki- 
muksen puutteita (ks. Lingvistinen etnografia toimintayhteisöissä tk.). 
Sosiokognitiivisessa lahestymistavassa käännösprosessin tutkimukses- 


sa otetaan huomioon kääntäjän ja hänen ympäristönsä vuorovaikutus, 
johon sisältyy paitsi työkalujen käyttö myös esimerkiksi kontaktit kol- 
legoihin ja asiakkaisiin (Risku 2014; Risku ja muut 2017). Tutkija voi 
videoida kääntäjää tämän työskennellessä omassa työympäristössään 
tai havainnoida ja tehdä muistiinpanoja. Muistiinpanojen tarkkuutta 
lisää, jos tutkija puhuu ne auki välittömästi havainnointitilanteen jäl- 
keen sekä nauhoittaa ja litteroi puheensa (Risku 2014). Bundgaardin, 
Paulsen Christensenin ja Schjoldagerin (2016) tutkimuksessa ihmisen 
ja koneen välisestä vuorovaikutuksesta käytettiin makrotason analyysis- 
sa etnografisia menetelmiä (havainnointia, haastatteluja, dokumenttien 
analyysia) ja mikrotason analyysissa kokeellisia menetelmiä (näppäin- ja 
kuvaruututallennusta, haastatteluja, kyselyjä). 

Käännösprosessia voidaan tutkia myös tarkastelemalla eri käännös- 
versioita ja muita käännöksiin liittyviä dokumentteja, kuten kääntäjien 
päiväkirjoja, kustantajien ja kääntäjien kirjeenvaihtoa ja muuta arkisto- 
materiaalia (Munday 2015). Tällainen tutkimus on osoittanut, että käännök- 
sen takana voi olla hyvin monia toimijoita (Walker 2017). Kääntäjien yh- 
teistyö ja yhteiskääntäminen ei ilmiönä ole uusi, mutta se on saanut uusia 
muotoja sähköisten verkkotyökalujen myötä. Esimerkkinä tästä on käännös- 
ten joukkoistaminen, jossa vapaaehtoinen verkkoyhteisö tuottaa käännök- 
sen. Yhteiskääntämistä on tutkittu muun muassa kyselyjen ja haastattelujen 
avulla (ks. tarkemmin Jiménez-Crespo 2016). Mikäli käännöstä tuotetaan 
yhdessä samassa tilassa, prosessia voidaan tutkia myös multimodaalisen 
vuorovaikutuksen tutkimuksen keinoin (Hirvonen & Tiittula 2018). 

Tulkkauksen tutkimuksessa Pöchhacker (2004, 64) erottaa kolme 
pääasiallista lähestymistapaa: kenttätutkimuksen, kyselyn ja kokeellisen 
tutkimuksen. Kenttätutkimuksessa aineistoa kerätään aidosta ympäris- 
töstä havainnoimalla tai tallentamalla. Tulkkaustilanteiden tallentami- 
seen voi olla vaikea saada nauhoitus- ja erityisesti videointilupia, min- 
kä vuoksi tutkija voi joutua turvautumaan pelkkiin muistiinpanoihin. 
Tällöin havaintojen ja muistiinpanojen systematiikkaan ja analyysiin 
on kiinnitettävä erityistä huomiota. Tallenteiden avulla ja diskurssi- ja 
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keskustelunanalyyttisin metodein voidaan analysoida tulkkausvuoro- 
vaikutusta, esimerkiksi sitä, miten tulkki koordinoi vuorovaikutusta 
(Wadensjö 1998) tai miten erilaiset tulkkausstrategiat vaikuttavat tulkat- 
tavien osallistumismahdollisuuksiin (Gavioli & Baraldi 2011), tai tulkin 
ei-verbaalin viestinnän merkitystä (Mason 2012). Lisäksi on mahdol- 
lista analysoida vuorovaikutuksen muiden osapuolten, kuten oikeus- 
tulkkauksessa tuomareiden ja asianajajien, toimintaa eli sitä, miten he 
työskentelevät tulkin kanssa ja tulkin välityksellä asiakkaan kanssa (Kin- 
nunen 2010; 2013). Tavallisesta monikielisestä arkivuorovaikutuksesta 
ja työelämästä taltioidut tilanteet puolestaan tuovat ilmi, kuinka tulk- 
kaus voi limittyä monikielisten osallistujien muuhun kielelliseen vuoro- 
vaikutukseen ja muihin rooleihin (Harjunpää 2017; Koskela, Koskinen 
& Pilke 2017). Maallikkotulkkien tulkkeiden analyysi taas nostaa esiin 
sen, millaisia eettisiä ja laatuongelmia kouluttamattoman tulkin käyttö 
voi aiheuttaa (Pöchhacker & Kadric 1999). 

Aitojen ja vertailukelpoisten tulkkausaineistojen puuttuessa on käy- 
tetty simuloituja tulkkaustilanteita. Tällöin tärkeää on, että osallistujat 
toimivat niissä rooleissa, joissa he toimivat ammatillisesti. Esimerkiksi 
näin on vertailtu poliisikuulustelujen kasvokkaista tulkkausta etätulk- 
kaukseen (Braun & Taylor 2011). Usein prosessia tutkitaan myös analy- 
soimalla lähde- ja kohdekielisiä korpuksia (ks. luku 3.2.). 


Katsauksia käännösprosessin tutkimukseen ja metodikirjallisuutta: 


Englund Dimitrova, Birgitta. 2016. Translation process. Julkaisussa: 
Gambier, Yves & Doorslaer, Luc van (toim.). 2010-2016. Handbook of 
Translation Studies Online. [verkkoaineisto]. Amsterdam: John Benjamins. 


Jääskeläinen, Riitta. 2011a. Studying the translation process. Julkaisus- 
sa: Malmkjaer, Kirsten & Windle, Kevin (toim.) The Oxford Handbook of 
Translation Studies. Oxford: Oxford University Press, 123-135. 


Risku, Hanna. 2012. Cognitive approaches to translation. Julkaisussa: 
Chapelle, Carol A. (toim.) The Encyclopedia of Applied Linguistics. [verkko- 
aineisto]. DOI: 10.1002/9781405198431.wbealo145. 
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Ajankohtaisia kokoomateoksia käännösprosessin tutkimuksesta: 


Alvstad, Cecilia, Englund Dimitrova, Birgitta, Hild, Adelina & Tiselius, 
Elisabet (toim.). 2011. Methods and Strategies of Process Research: 
Integrative Approaches in Translation Studies. Amsterdam: John Benjamins. 


Ehrensberger-Dow, Maureen, Göpferich, Susanne & O'Brien, Sharon 
(toim.). 2015. Interdisciplinarity in Translation and Interpreting Process 
Research. Amsterdam: John Benjamins. 


Muñoz Martín, Ricardo (toim.). 2014. Minding Translation. MonTI, 
Special Issue 1. Saatavissa: http://rua.ua.es/dspace/handle/10045/43719. 


Muñoz Martin, Ricardo (toim.). 2016. Reembedding Translation Process 
Research. Amsterdam: John Benjamins. 


O'Brien, Sharon (toim.). 2011. Cognitive Explorations of Translation. 
London: Continuum. 


Shreve, Gregory M. & Angelone, Erik (toim.). 2010. Translation and 
Cognition. Amsterdam: John Benjamins. 


3.4. Toimijoiden, toimintaympäristön ja vastaanoton 
tutkimus 


Toimijoiden ja toimintaympäristön tutkimuksessa tavanomainen lä- 
hestymistapa on etnografinen, sillä etnografia pyrkii kuvaamaan yk- 
sityiskohtaisesti kulttuuria, yhteisöä tai ryhmää, sen instituutioita, 
uskomuksia, tuotteita ja käyttäytymistä sosiaalisessa kontekstissaan 
(ks. esim. Fetterman 2011). Ryhmän toimintaa ei tarkastella vain tut- 
kijan näkökulmasta, vaan olennaista on yhteisöön kuuluvien näkökul- 
ma. Etnografinen tutkimusote on tullut yhä suositummaksi käännös- 
tieteessä 2000-luvulla, kun tutkijat ovat kiinnostuneet kääntämisestä ja 
tulkkaamisesta sosiaalisena ja tilanteisena toimintana, kääntämisen ja 
tulkkauksen käytänteistä ja prosesseista, toimintaympäristöistä, toimi- 
joista sekä kääntäjän tai tulkin roolista käännös- ja tulkkausviestinnässä. 
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Etnografian ydintä ovat kenttätutkimus ja yhteisön toiminnan havain- 
nointi sen luonnollisessa ympäristössä, mutta aineisto ja sen keruun 
ja analyysin menetelmät ovat moninaiset, ja tyypillisesti tutkimuksessa 
yhdistetään monenlaisia aineistoja ja useampia menetelmiä (ks. Ling- 
vistinen etnografia toimintayhteisöissä tk.). 


Sekä haastattelujen että kyselyjen avulla on selvitetty kääntäjien ja 
tulkkien näkemyksiä heidän ammatillisesta statuksestaan ja identitee- 
tistään sekä roolistaan. Esimerkiksi Katan (2009) teki maailmanlaajui- 
sen internetkyselyn, jossa selvitettiin vastaajien näkemyksiä kääntäjän 
ja tulkin roolista, ammatin statuksesta, ammatillisesta tyytyväisyydestä 
ja koulutuksesta. Kyselyyn vastasi noin 1 ooo kääntäjää ja tulkkia sekä 
kääntämisen opettajaa ja opiskelijaa. Damin ja Zethsenin kyselytutki- 
mukset (esim. 2012) eri tehtävissä toimivien tanskalaisten kääntäjien 
statuksesta ovat olleet esimerkkeinä myös suomalaisille vastaaville tut- 
kimuksille (esim. Ruokonen 2016). 

Etnografinen tutkimus on tyypillisesti monimenetelmäistä, ja se 
pyrkii antamaan kohteestaan monipuolisen ja rikkaan kuvauksen. 
Antropologian käsite tiheä kuvaus (engl. thick description) on siirretty 
käännöstieteeseen käsitteellä thick translation (Appiah 1993). Tyypillises- 
ti tällainen etnografinen tutkimus yhdistää havainnointia, haastattelua 
tai kyselyä sekä tekstien tai dokumenttien analyysia. Varhaisimpia laajo- 
ja etnografisia tutkimuksia on Susan Berk-Seligsonin (1990) tutkimus 
espanja-englanti-oikeustulkkauksesta Yhdysvalloissa. Hän havainnoi 
oikeussalissa tulkkausta päivittäin seitsemän kuukauden ajan, nauhoitti 
tulkkauksia yhteensä 114 tuntia ja analysoi nauhoitukset. Lisäksi hän 
haastatteli sekä tulkkeja että viranomaisia. Kaisa Koskisen (2008) etno- 
grafinen tutkimus tarkasteli EU:n komission kääntämistä. Hän tutki 
institutionaalista kontekstia ja kääntäjiä, jotka toimivat tässä konteks- 
tissa, sekä käännettyjä dokumentteja ja niiden lähdetekstejä. Menetel- 
minä olivat fokusryhmähaastattelu, kysely, (osallistuva) havainnointi 
ja tekstien analyysi (käännössiirtymien analyysi ja kriittinen diskurssi- 
analyysi). Koskisen tutkimus on myös esimerkki käännöstieteellisestä 
tapaustutkimuksesta; tapaus on rajattu Euroopan komission Suomen 
Luxemburgissa sijaitsevaan käännösyksikköön. Tapaustutkimus on niin 
ikään Hokkasen (2016) autoetnografinen tutkimus, jossa hän havainnoi 


LUKU 23 KÄÄNNÖSTIEDE JA SEN MENETELMÄT 969 


tulkkausta helluntaiseurakunnassa, piti kirjaa omista tulkkauskokemuk- 
sistaan ja nauhoitti omia tulkkauksiaan. 

Kuten edelliset esimerkit osoittavat, etnografisissa tutkimuksissa 
yhdistyvät usein tuotteen, prosessin, toimijoiden, toimintaympäristön 
ja vastaanoton tutkimukset, jotka tässä artikkelissa olemme selvyyden 
vuoksi osin erottaneet omiksi luvuikseen. Esimerkiksi Ebru Dirikerin 
(2004) tutkimuksessa konferenssitulkkauksesta aineistona oli nauhoi- 
tettuja tulkkauksia, tulkkauksesta käytyä julkista keskustelua sekä konfe- 
renssitulkkien, järjestäjien, puhujien ja osallistujien haastatteluja. Kuten 
Dirikerin tutkimuksessa käännöstieteellinen tutkimus on kääntäjien ja 
tulkkien lisäksi kiinnostunut myös muista kääntämisen ja tulkkauksen 
kentän toimijoista. 

Etnografisessa tutkimuksessa käytetään myös bibliografisia aineisto- 
ja ja arkistodokumentteja; kiinnostuksen kohteena voi olla esimerkiksi 
tietyn aikakauden käännös- ja tulkkaustoiminta (Kujamäki & Paloposki 
2015). Historiallinen tutkimus voi kohdistua myös yhteen henkilöön, 
esimerkkinä Paloposken tutkimus Samuli Suomalaisesta (1850—1907) 
kääntäjänä (Paloposki 2017). 

Kenttätutkimuksesta uudenlaisia esimerkkejä ovat translationaali- 
sen tilan tutkimus eli monikielisen tilan tarkasteleminen kääntämisen 
paikkana (Koskinen 2013a), kuten Tampereen kielimaiseman tutkimus 
”käännettyyden” näkökulmasta (Koskinen 2013b) ja Helsinki-Pietari- 
väliä pendelöivän Allegro-junan monikielisen viestinnän tutkimus 
(Probirskaja 2017). Molemmissa tutkimuksissa havainnointi on kes- 
keinen aineiston keruun menetelmä, edellisessä aineistona on lisäksi 
valokuvia, jälkimmäisessä ohjeita ja haastatteluja. 

Kääntämisen ja tulkkauksen vastaanoton tutkimuksessa tarkastellaan 
käännöksen tai tulkkauksen käytettävyyttä, hyväksyttävyyttä ja ymmär- 
rettävyyttä, yleisesti ottaen laatua. Laatu on riippuvainen kääntämisen 
tai tulkkauksen tarkoituksesta ja vastaanottajan tarpeista. Esimerkiksi 
konferenssitulkkauksen osanottajilla, oikeusprosessin viranomaisil- 
la ja lääkärin vastaanoton potilaalla voi olla hyvin erilaisia odotuksia 
tulkkaukselle, minkä vuoksi tulkkauksen laadulle on vaikea määritellä 
yleisiä kriteereitä. Odotukset voivat vaihdella myös sen mukaan, mitä 
kussakin kulttuurissa minäkin aikana pidetään hyvänä tulkkauksena. 
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Esimerkiksi monessa maassa juristit odottavat oikeustulkkaukselta sa- 
nasanaista tulkkausta (Kalina 2016), mutta Kadricin (2001) kyselytut- 
kimuksen mukaan Itävallassa tuomarit pitävät tärkeämpänä tyylin ja 
rekisterin uskollisuutta. Konferenssitulkkausta koskevissa kyselytutki- 
muksissa (esim. Vuorikoski 1996) on yleisesti todettu, että keskeisiä 
laatutekijöitä ovat uskollisuus alkuperäiselle puheelle, sisältö, synkronia, 
retoriset taidot ja äänenlaatu. Tärkeitä ovat niin ikään täydellisyys, il- 
mauksen selkeys ja terminologian tarkkuus. Toisaalta on myös havaittu, 
että odotukset vaihtelevat muun muassa kokoustyypin ja osallistujien 
simultaanitulkkauskokemuksen mukaan. (Pöchhacker 2004, 154.) Vas- 
taavia kyselytutkimuksia on tehty myös esimerkiksi asiatekstien kään- 
nösten tilaajille (esim. Havumetsä 2012). 

Vastaanoton tutkimuksessa voidaan käyttää autenttisten käännösten 
ja tulkkausten lisäksi koeasetelmia, joissa tutkitaan, miten käännöksen 
tai tulkkauksen eri tekijät vaikuttavat vastaanottoon. Esimerkiksi Hale, 
Martschuk, Ozolins ja Stern (2017) ovat tutkineet simuloitujen oikeus- 
tulkkausten avulla sitä, miten tulkkauslaji (konsekutiivi vs. simultaani) 
vaikuttaa lautamiesten arviointiin todistajan uskottavuudesta. 

Uusista menetelmistä silmänliiketutkimus soveltuu myös tekstin 
luettavuuden ja ymmärrettävyyden tutkimukseen; esimerkiksi O'Brien 
(2010) on tutkinut konekäännetyn tekstin luettavuutta. Taivalkoski- 
Shilov ja Koponen (2017) ovat yhdistäneet silmänliiketutkimusta, 
haastatteluja ja osallistujien narratiivisia raportteja tutkiessaan, miten 
paratekstit ja lukijoiden akateeminen tausta vaikuttavat tieteellisen 
tekstin vastaanottoon. Silmänliiketutkimusta on käytetty lisäksi erityi- 
sesti tekstityksen vastaanottotutkimuksissa, joissa on selvitetty muun 
muassa tekstin määrän ja muodon (tiivistetty vs. puhetta tarkkaan nou- 
dattava) vaikutusta ymmärrettävyyteen ja elokuvan katsomiseen (esim. 
Szarkowska, Krejtz, Klyszejko & Wieczorek 2011). Lang, Mäkisalo, 
Gowases ja Pietinen (2013) selvittivät silmänliiketutkimuksen avulla 
sitä, miten ruututekstityksen konventioiden noudattaminen vaikuttaa 
vastaanottoon. Silmänliiketutkimukseen yhdistetään usein kysely, jolla 
testataan tekstitetyn ohjelman ymmärtämistä. 

Tekstityksen vastaanottoa on tutkittu myös fokusryhmien avul- 
la, jolloin kohderyhmään kuuluvat vastaanottajat voivat keskustella 
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tekstityksestä sekä katsoessaan tekstitettyä elokuvaa että välittömästi 
katsomisen jälkeen (esim. Tuominen 2012; Tiittula 2016). Fokusryhmä- 
tutkimuksen etuna esimerkiksi kyselyihin verrattuna on se, että yleis- 
ten näkemysten lisäksi saadaan konkreettisiin esiintymiin kommentte- 
ja sekä argumentointia eri ratkaisujen puolesta ja niitä vastaan. Usein 
vastaanottotutkimuksissakin yhdistetään monia menetelmiä, kuten 
Orrego-Carmona (2016) teki tutkiessaan, erottavatko katsojat ammatti- 
tekstittäjän tekstityksen harrastajatekstittäjän tuotoksesta. Tutkimuk- 
sessa katsojille näytettiin eri tavoin tekstitettyjä elokuvakatkelmia ja vas- 
taanottajien reaktioita tutkittiin silmänliikkeiden, kyselyn ja haastattelun 
avulla. Käännetyn kirjallisuuden vastaanoton tutkimuksessa voidaan 
käyttää edellä mainittujen menetelmien lisäksi arvosteluja, julkisia kes- 
kusteluja, lukijapalautteita sekä tilastoja. 


Toimijoiden ja toimintaympäristön tutkimusta: 
Angelelli, Claudia (toim.). 2014. The Sociological Turn in Translation and 
Interpreting Studies. Amsterdam: John Benjamins. 


Biagin, Marta, Boyd, Michael S. & Monacelli, Claudia (toim.). 2017. The 
Changing Role of the Interpreter. Contextualising Norms, Ethics and Ouality 
Standards. New York (NY): Routledge. 


Dam, Helle V. & Zethsen, Karen Korning (toim.). 2009. Translation 


studies: Focus on the translator. Hermes, Special issue 42. Saatavissa: 
https://tidsskrift.dk/her/issue/view/2853. 


Kinnunen, Tuija & Koskinen, Kaisa (toim.). 2010. Translators' Agency. 
Tampere Studies in Language, Translation and Culture. Series B 4. 
[verkkoaineisto]. Tampere: Tampere University Press. Saatavissa: http:// 
urn.fi/urn:isbn:978-951-44-8082-9. 


Sela-Sheffy, Rakefet & Shlesinger, Miriam (toim.). 2011. Identity and 
Status in the Translational Professions. Amsterdam: John Benjamins. 
Taivalkoski-Shilov, Kristiina, Tiittula, Liisa & Koponen, Maarit (toim.). 
2017. Communities in Translation and Interpreting. Vita traductiva 9. 
Montréal: Éditions québécoises de l'ceuvre. 
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Kääntämisen historian tutkimuksen menetelmistä: 


Pym, Anthony. 1998. Method in Translation History. Manchester: St. 
Jerome. 


Käännöstieteellisistä vastaanottotutkimuksista ja niissä käytetyistä me- 
netelmistä: 

Suojanen, Tytti, Koskinen, Kaisa & Tuominen, Tiina. 2012. Käyttäjäkeskei- 
nen kääntäminen. [verkkoaineisto]. Tampere: Tampereen yliopisto. Saata- 
vissa: http://urn.fiJ URN:ISBN:978-951-44-8839-9. 


4. Yhteenveto 


Katsaus käännöstieteen historiaan, tutkimusaineistoihin, -mene- 
telmiin ja -kysymyksiin nostaa esille tieteenalan itsenäistymisen 
emotieteenaloista. Temaattisesti kehitys on kulkenut produktin, 
kirjoitettujen käännösten ja puhuttujen tulkkeiden tutkimuksesta 
multimodaalisiin tuotoksiin ja vuorovaikutustilanteisiin sekä toiminta- 
prosessien, toimijoiden, toimintaympäristöjen ja vastaanoton kysy- 
mysten tutkimukseen. Menetelmällisesti kehitys on yhtäältä säilyttänyt 
perinteisiä tekstianalyysin manuaalisia menetelmiä mutta tuonut toi- 
saalta mukanaan siirtymän tallennuksessa, mittauksessa ja analyysis- 
sa tietokoneohjelmiin sekä sähköisiin mittaus- ja tallennusvälineisiin. 
Mukaan on tullut myös toimintakentän, toimijoiden ja vastaanottajien 
etnografinen tutkimus. Yhä useammin tutkimus on moniaineistoista 
ja monimenetelmäistä. Menetelmien ja välineiden kehittyessä on kiin- 
nitetty myös enemmän huomiota tutkimuskysymyksiin, jotka nouse- 
vat yhteiskunnasta. Kääntämisen ja tulkkauksen ilmiöt ovat jatkuvan 
muutoksen alaisia. Yhteiskunnallisten ja teknologisten muutosten 
myötä syntyy uusia kääntämisen ja tulkkauksen alueita ja muotoja, joi- 
ta on vaikea sijoittaa vanhoihin kategorioihin. Tällainen on esimerkiksi 
reaaliaikainen tekstitys. Käännös- ja kieliteknologia, ihmisen ja koneen 


LUKU 23 KÄÄNNÖSTIEDE JA SEN MENETELMÄT 973 


välinen vuorovaikutus sekä yhä monikielisempi yhteiskunta ja saavu- 
tettavuuden haasteet asettavat uusia tehtäviä käännöstieteelliselle tut- 
kimukselle. Samalla vaatimus tieteidenvälisyydestä on kasvanut, vaikka 
käännöstiede onkin aina ollut pohjimmiltaan monitieteistä. 


Aiheesta lisää: 


Käännöstieteellisen tutkimuksen ajankohtaisia käsikirjoja: 


Gambier, Yves & Doorslaer, Luc van (toim.). 2010-2016. Handbook of 
Translation Studies Online. [verkkoaineisto]. Amsterdam: John Benjamins. 


Malmkjar, Kirsten & Windle, Kevin (toim.). 2011. Oxford Handbook of 
Translation Studies. Oxford: Oxford University Press. 


Millän, Carmen & Bartrina, Francesca (toim.). 2013. Routledge Handbook 
of Translation Studies. London: Routledge. 


Pöchhacker, Franz (toim.). 2015. Routledge Encyclopedia of Interpreting 
Studies. New York (NY): Routledge. 


Käännöstieteellisen tutkimuksen ajankohtaisia metodioppaita: 


Angelelli, Claudia & Baer, Brian James (toim.). 2015. Researching 
Translation and Interpreting. New York (NY): Routledge. 


Bogucki, tukasz. 2016. Areas and Methods of Audiovisual Translation 
Research. (2. uud. laitos). Frankfurt am Main: Peter Lang Edition. 


Hale, Sandra & Napier, Jemina. 2013. Research Methods in Interpreting: 
A Practical Resource. New York (NY): Continuum. 


Olohan, Maeve (toim.). 2000. Intercultural Faultlines. Research Modals 
in Translation Studies |. Textual and Cognitive Aspects. Manchester: 
St. Jerome. 


Saldanha, Gabriela & O’Brien, Sharon. 2013. Research Methodologies in 
Translation Studies. London: Routledge. 
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Muita hyödyllisiä lähteitä: 


Gambier, Yves & Doorslaer, Luc van (toim.). 2004-. Translation Studies 
Bibliography. [verkkoaineisto]. Amsterdam: John Benjamins. 
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Luku 24 Psyko- ja neurolingvistiikka 


Leena Maria Heikkola 
O https: //orcid.org/0000-0002-1795-7656 


Seppo Vainio 


Mika? 


Psykolingvistiikka on tutkimusalue, jossa tutkitaan ihmisen kielen ja 
mielen välistä suhdetta. Neurolingvistiikassa puolestaan tarkastellaan 
ihmisen aivotoimintojen ja kielen välistä suhdetta. Sekä psyko- että 
neurolingvistiikka ovat kokeellisia tieteenaloja. Erityisesti näillä aloilla 
tutkitaan kokeellisin menetelmin puhutun ja kirjoitetun kielen ymmärtä- 
mistä, tuottamista ja oppimista. 


Katso myös: 
Luku 1 Kielitaju kielentutkijan työkaluna 
Luku 4 Kokeellinen fonetiikka 


Luku 17 Kieliopin tutkimus ja kielioppiteoriat 
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1. Johdanto 


Psykolingvistiikka ja neurolingvistiikka ovat kokeellista kielentutkimusta 
(ks. myös Kokeellinen fonetiikka tässä kirjassa). Kokeellisen kielentutki- 


muksen tutkimuskohteena on kielen prosessointi, jolla viitataan siihen, 
miten ihmiset ymmärtävät kielellisiä viestejä ja tuottavat kieltä ilmais- 
takseen ajatuksiaan ja tunteitaan. Alalla tutkitaan esimerkiksi, miten 
kieltä ymmärretään ja tuotetaan tai miten kielen prosessointi kehittyy 
lapsilla tai vieraan kielen oppijoilla. 

Psykolingvistiikassa tarkastellaan kielen ja mielen suhdetta eli sitä, 
miten ihmiset omaksuvat, käyttävät, ymmärtävät ja tuottavat kieltä. Esi- 
merkiksi voidaan tutkia, miten sanat on säilötty mielen sanastoon eli 
mentaalileksikkoon, jolla tarkoitetaan ihmisen mielessä olevaa sano- 
jen ja kieliopillisten rakenteiden varastoa. Kaksikielisillä voidaan tutkia, 
muodostavatko molempien kielten sanat mielessä yhden suuren leksi- 
kon vai kaksi erillistä leksikkoa. Psykolingvistiikassa ollaankin kiinnos- 
tuneita siitä, miten kieltä prosessoidaan ja miten kieli järjestyy mielessä. 
Neurolingvistiikassa puolestaan tarkastellaan kielen ja aivojen suhdetta. 
Siinä tutkitaan aivomekanismeja, jotka osallistuvat kielen oppimiseen, 
tuottamiseen, ymmärtämiseen ja käyttöön. Esimerkiksi voidaan tarkas- 
tella, mitkä aivojen osat aktivoituvat, kun henkilö kuuntelee ja ymmärtää 
äidinkielensä puhuttuja lauseita. Neurolingvistiikassa kielen prosessoin- 
tia tarkastellaan usein erilaisten kielihäiriöiden näkökulmasta (Obler 
1999). 

Sekä psyko- että neurolingvistiikassa tutkitaan kielen prosessointia 
erilaisin kokeellisin menetelmin, ja tutkimuskohde voi vaihdella pie- 
nistä yksityiskohdista suuriin kokonaisuuksiin, foneemista tekstiin ja 
diskurssiin. Tutkimusta ohjaavat erilaiset kielen prosessoinnin teoriat, 
jotka puolestaan perustuvat kielitieteellisiin ja psykologisiin teorioihin. 
Kokeellisessa kielentutkimuksessa tarkastellaan kielen prosessointia 
pääasiassa äidinkielen puheen ja kirjoitetun tekstin ymmärtämisen, kie- 
len tuottamisen, kaksikielisyyden sekä vieraan kielen oppimisen näkö- 
kulmista. Usein jotakin teemaa tarkastellaan vertaillen eri kieliä, jotta 
saadaan selville, onko kyseessä yleiseen kielen prosessointiin liittyvä asia 
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vai onko kyse kielikohtaisesta erityispiirteestä. Kokeellisen kielentutki- 
muksen koehenkilöt (tästä eteenpäin KH) voivat olla aikuisia, lapsia, 
vieraan kielen oppijoita, kaksi- tai monikielisiä, jonkin erikoisryhmän 
jäseniä tai ihmisiä, joilla on jokin sairaus. Valtaosa psykolingvistises- 
tä tutkimuksesta kohdistuu ns. normaaliin kielen prosessointiin, kun 
taas neurolingvistiikassa tarkastellaan usein neurologisia populaatioita, 
esimerkiksi MS-tautia tai afasiaa sairastavia. Kokeellinen kielentutkija 
nojautuu moniin lähitieteisiin, joista tärkeimpiä ovat kielitiede, psyko- 
logia, neurotiede, kognitiotiede, neurobiologia ja logopedia. Määrällinen 
aineistotutkimus on menetelmiltään usein samankaltaista kuin kokeel- 
linen kielentutkimus (ks. tarkemmin luku 3.7.). 

Seuraavaksi luvussa 2 esittelemme lyhyesti psyko- ja neurolingvis- 
tiikan taustaa ja kielikäsitystä. Luvussa 3 esittelemme psyko- ja neuro- 
lingvistiikassa käytettyjä menetelmiä, yleisiä tutkimuskohteita, mene- 
telmien rajoitteita sekä alan lähitieteitä. Lisäksi esitellään tarkemmin 
psykolingvistiikan ja neurolingvistiikan tutkimusta. Päätämme luvun 
lyhyeen yhteenvetoon. Luvun lopussa on lisälukemisto, jonka pohjalta 
lukija voi etsiä lisätietoa. 


Psyko- ja neurolingvistiikan keskeisiä käsitteitä 


Kielen prosessointi tarkoittaa tapaa, jolla ihmiset käyttävät kieltä ilmais- 
takseen kielellisesti ajatuksiaan ja tunteitaan, sekä sitä, miten kommu- 
nikaatiota ymmärretään. 


Koehenkilö (KH) on yksilö, joka osallistuu kokeelliseen tutkimukseen. 
Jotta koehenkilö voidaan valita tutkimukseen, hänelle tulee kertoa tut- 
kimuksesta ja hänen tulee antaa kirjallinen suostumus osallistumiseen. 


Ärsykkeiden vertaistaminen tarkoittaa sitä, että käytetyn testin ärsykkeet, 
esimerkiksi sanat, valitaan niin, että ne vastaavat toisiaan mahdollisim- 
man tarkasti erilaisten tekijöiden suhteen. Tällaisia tekijöitä voivat olla 
esimerkiksi sanan pituus, sanan yleisyys ja sanan oppimisikä. 


Koehenkilön sisäinen tarkastelu tarkoittaa, että esimerkiksi morfologi- 
sen monimutkaisuuden vaikutusta reaktioaikaan tutkitaan siten, että 
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koehenkilö saa sekä morfologisesti yksinkertaiset että morfologisesti 
monimutkaiset sanat tunnistettavakseen, jolloin koehenkilö on itsen- 
sä verrokki. Koehenkilöiden välinen tarkastelu tarkoittaa, että tutkitaan 
asiaa, jossa koehenkilö joko kuuluu tai ei kuulu keskeiseen ryhmään. 
Tyypillisimmillään kyse on interventiomenetelmän toimivuuden testaa- 
misesta. Intervention tehoa tutkitaan siten, että satunnaistetaan koe- 
henkilöt eri ryhmiin, joista vain yksi ryhmä saa intervention, esim. heille 
opetetaan kieltä tietyllä opetusmenetelmällä. Toinen eli kontrolliryhmä 
saa esimerkiksi perinteistä kielenopetusta tai ei saa opetusta lainkaan. 


Visuaalinen tehtävä tehdään näköaistin ja auditiivinen tehtävä kuulo- 
aistin perusteella. 


Formalistinen kielikäsitys perustuu lainalaisuuksien löytämiseen kielestä, 
funktionaalinen kielikäsitys kielen käyttöön ja kognitiivinen kielikäsitys 
siihen, että kieli on yksi kognition osa-alue. 


Verrokki on koeasetelmassa tiettyyn koehenkilöön tai ryhmätasolla 
taustamuuttujiltaan vertaistettu osallistuja. 


Hypoteesi tarkoittaa kokeellisessa tutkimuksessa testattavaa oletusta 
tutkimusasetelman tuloksesta. Hypoteeseja on vähintään kaksi: nolla- 
hypoteesi, jonka mukaan mitattavien muuttujien välillä ei ole yhteyttä, 
ja tutkimushypoteesi, jossa oletetaan muuttujien välille yhteys, esim. 
”Morfologinen monimutkaisuus hidastaa reaktioaikaa". 


Riippumattomat muuttujat (tekijä, variaabeli) ovat asetelmassa olevia 
muuttujia, jotka joko vakioidaan tai joita manipuloidaan tilanteen mu- 
kaan. Riippumaton vakioitu muuttuja voi olla esim. sanan esiintymis- 
yleisyys ja manipuloitu muuttuja sanan morfologinen monimutkaisuus. 
Riippuvat muuttujat ovat tutkimuksen selitettäviä asioita, joista halutaan 
saada selvyyttä, esim. reaktioaika. 


Vastabalansoitu koeasetelma on tyypillisesti käytössä tilanteissa, jois- 
sa koehenkilölle ei voi esittää kaikkia koetilanteita, koska tällöin tulisi 
liikaa toistoa. Tällaisissa tapauksissa koehenkilöt jaetaan ryhmiin ja he 
saavat saman määrän ärsykkeitä mutta eri koetilanteista. Jos esim. tut- 


kitaan assosiaation vaikutusta sanantunnistusaikaan, voidaan käyttää 
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pareja, kuten herätesana ”kissa” ja kohdesana ”koira” tai ”pöytä”. Toinen 
ärsykeryhmä voisi olla herätesana "ahma" ja kohdesana "poro" tai ”kivi”. 
Ryhmä 1 saisi parit ”kissa” > ”koira” ja ”ahma” > ”kivi”, ryhmä 2 parit 
"kissa" > ”pöytä” ja ”ahma” > "poro". 


Pilotointi tarkoittaa koeasetelman teknistä testaamista käytännössä eli 
pilottikokeiden ajoa. Pilotoinnissa viimeistään nähdään, eteneekö koe- 


tilanne suunnitelmien mukaisesti. 


Temporaalinen resoluutio tarkoittaa sitä, kuinka tarkka aivokuvantamis- 
menetelmä on ajallisesti, ja spatiaalinen resoluutio sitä, kuinka tarkka 
se on sijainniltaan. 


2. Kokeellisen kielentutkimuksen taustaa 
2.1. Historiallista taustaa 


Psyko- ja neurolingvistiikka ovat saaneet alkunsa 1800-luvulla, mutta 
tämänhetkisen muotonsa kokeellinen kielentutkimus on saavuttanut 
1980-1990-luvuilla. Aivokuvantamisen ja tietokoneiden kehittymisen 
myötä ala on nopeassa kasvussa. 

Wilhelm Wundt (1832-1920) lienee merkittävin yksittäinen kokeel- 
lisen kielentutkimuksen kehittäjä, ja häntä luonnehditaankin usein 
kokeellisen psykologian isäksi (McLeod 2008). Wundt perusti ensim- 
mäisen kokeellisen tutkimuksen ja psykolingvistiikan laboratorion 
Leipzigin yliopistoon vuonna 1879. Wundt tutki mieltä ja ajattelua sys- 
temaattisella tavalla, jossa objektiiviset mittarit ja kokeellisten asetelmi- 
en tarkka kontrollointi olivat keskeisessä asemassa (mt.). Voidaankin 
sanoa, että Wundt käytti kieltä keinona tutkia mieltä. Wundt kirjoitti 
aiheista, jotka ovat yhä nykyäänkin ajankohtaisia, kuten kielen oppimi- 
nen, ymmärtäminen ja tuottaminen, viittomakieli ja lukeminen (Levelt 
2014). Wundtin Die Sprache vuodelta 1900 (Wundt 1975) oli ainut- 
kertainen kielitieteet yhdistävä teos, joka lopetti vuosisataisen väittelyn 
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siitä, miten kieli syntyy mielessä (mt.). Vaikka termin psykolingvistiikka 
(engl. psycholinguistics) otti ensimmäisenä käyttöön Jacob Kantor vuon- 
na 1936 (mt.), psykolingvistinen tutkimus lisääntyi voimakkaasti vasta 
1960-luvulla, erityisesti tietokoneiden käyttöönoton jälkeen. 

Neurolingvistiikka on puolestaan kehittynyt 1800-luvulla alkanees- 
ta afasian tutkimuksesta. Afasialla viitataan aivoperäisiin kielihäiriöi- 
hin (ks. tarkemmin Klippi, Korpijaakko-Huuhka & Lehtihalmes 2017). 
Afasian tutkimuksessa (engl. aphasiology) yritetään selvittää, mitkä aivo- 
mekanismit osallistuvat esimerkiksi kielen tuottamiseen ja ymmärtä- 
miseen tarkastelemalla aivovaurioiden vaikutusta kielen prosessointiin. 
Ranskalainen kirurgi Paul Broca (1824-1880) toi ensimmäisten jou- 
kossa esiin yhteyden tietyn aivoalueen ja kielen prosessoinnin välillä. 
Broca teki ruumiinavauksia henkilöille, joilla oli ollut puhehäiriöitä, ja 
hän huomasi, että useilla heistä oli aivovaurio vasemmassa etulohkos- 
sa. Aivoalue tunnetaan nykyään Brocan alueena. Lääkäri Carl Wernicke 
(1848-1905) ehdotti myöhemmin, että aivojen eri osa-alueet ovat eri- 
koistuneet erilaisiin kielellisiin toimintoihin: Brocan alue vastaa puheen 
motorisesta tuottamisesta ja Wernicken aivoalueena nykyään tunnettu 
alue auditiivisesta puheen ymmärtämisestä. Afasian tutkimus ja ajatus 
siitä, että kieltä voi tutkia aivojen fyysisten piirteiden kautta, vakiintui- 
vat Brocan ja Wernicken löytöjen pohjalta. 1900-luvun alussa neurologi 
Korbinian Brodmann (1868-1918) kartoitti aivot niiden pintarakenteen 
perusteella. Brodmannin alueita käytetään edelleen laajasti neuro- 
tieteissä. Neurolingvistiikka-termin toi käyttöön Alexandr Luria 1940- ja 
1950-luvuilla teoksellaan Problems in Neurolinguistics. Harry Whitaker 
popularisoi neurolingvistiikan Yhdysvalloissa 1970-luvulla perustamalla 
journaalin Brain and Language vuonna 1974. 


2.2. Psyko- ja neurolingvistiikan kielikäsityksestä 

Psyko- ja neurolingvistiikan tutkijat nojautuvat erilaisiin ja keskenään 
ristiriitaisiinkin kielikäsityksiin. Yleisimmät kielikäsitykset ovat kuiten- 
kin lähtökohdiltaan formalistisia, funktionaalisia, kognitiivisia tai näiden 


yhdistelmiä. Formalismissa pyritään löytämään kielen lainalaisuuksia, 
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funktionalismissa tarkastellaan kieltä sen käytön lähtökohdista, ja 
kognitivismissa kieltä tarkastellaan puolestaan yhtenä kognition osana. 
Merkittävin jakolinja eri suuntausten välillä liittyy niin sanotun genera- 
tiivisen kielitieteen formalistisiin näkemyksiin, jotka eivät ole yleises- 
ti hyväksyttyjä, ja toisaalta funktionaalisen kielitieteen ja kognitiivisen 
kielitieteen välisiin näkemyseroihin (ks. Kieliopin tutkimus ja kieliop- 
piteoriat tk.). Kokeellisen kielentutkimuksen kielikäsitystä ei useinkaan 
eksplisiittisesti ilmaista tutkimusraporteissa, joten lukijan tulee olla 
tarkkana ja sijoittaa tutkimus itse tietynlaisen kielikäsityksen piiriin. 


3. Psyko- ja neurolingvistiikan tutkimus 
3.1. Kokeellisen kielentutkimuksen perusteita 


Kokeellinen kielentutkimus on ensisijaisesti hypoteesin testausta. Tämä 
tarkoittaa sitä, että tutkijalla pitää olla selvät tutkimuskysymykset, joihin 
tutkimuksella pyritään saamaan vastauksia. Tutkimusasetelma suunni- 
tellaan siten, että kahden tai useamman KH-ryhmän tai koetilanteen vä- 
lille oletetaan tilastollisesti merkitsevä ero (tilastollisesta tutkimuksesta 
tarkemmin ks. Nummenmaa 2009). Jos tutkimuksen hypoteesissa ole- 
tettu ero ei ole tilastollisesti merkitsevä, kyseessä on nollatulos. Tällaisia 
tuloksia on erittäin vaikea julkaista. Tämä johtuu siitä, että nollatulok- 
seen voi olla myös muita syitä kuin se, että ilmiötä ei ole, esimerkiksi se, 
ettei koeasetelma ole ollut riittävän tarkka ilmiön esilletuomiseen, tai se, 
että ilmiö tulee esille jotenkin muuten kuin tutkittavalla tavalla. Hypo- 
teesin testaukseen perustuvaan tarkastelutapaan on kaksi poikkeusta: 
kliiniset tapaustutkimukset ja kliiniset koeasetelmat. Vaikka psyko- ja 
neurolingvistisessä tutkimuksessa tarkastellaan kielen prosessointia tai 
esiintymiä määrällisesti (kvantitatiivisesti), on kielentutkimuksessa aina 
mukana myös laadullinen (kvalitatiivinen) puoli. 

Kokeellisen kielentutkimuksen koeasetelmatyypeistä ja muuttujis- 
ta. Koska kokeellinen kielentutkimus on hypoteesin testausta, tarvitaan 
hypoteesin testaukseen sopiva asetelma. Hampton (1998) määrittelee 
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kolme keskeistä ohjetta sille, että kokeellinen asetelma on systemaat- 
tinen ja luotettava: manipuloi koeasetelma(t) tehokkaasti, pidä muut 
merkittävät tilanteet vakioina ja mittaa vaikutus tehokkaasti. Tehokkaan 
manipuloinnin mahdollistavat hyvin valitut riippuvat ja riippumattomat 
muuttujat (engl. dependent/independent variables). Riippumaton muut- 
tuja on se, jota kokeessa manipuloidaan (esim. sanapituus, frekvens- 
si, morfologinen rakenne, KH:n ikä tai äidinkieli). Vastaavasti riippuva 
muuttuja on variaabeli, jonka arvo on riippuvainen riippumattoman 
muuttujan manipuloinnista. Tutkimuksessa on myös hyvä varmistaa 
riippuvan muuttujan herkkyys: esimerkiksi reaktioaika ilmaisee virhe- 
määrää herkemmin, kuinka vaikeaa prosessointi on sanantunnistus- 
tehtävässä. Tyypillinen koetilanne on sellainen, että yksi tai muutama 
riippumaton muuttuja muutetaan halutulla tavalla ja muut riippumat- 
tomat muuttujat pidetään vakioina. Näin selvitetään se, miten riippu- 
mattoman muuttujan (tai riippumattomien muuttujien) manipulointi 
vaikuttaa yhteen tai useampaan riippuvaan muuttujaan (ks. luku 3.5.). 
Esimerkki selventää asiaa. Oletetaan, että tutkija on kiinnostunut sii- 
tä, vaikuttaako sanan pituus kirjaimina sen tunnistamisaikaan. Tutkija 
valmistelee kaksi ryhmää sanoja, jotka hän on vertaistanut esim. sana- 
frekvenssin ja morfologisen monimutkaisuuden osalta. Vertaistaminen 
tarkoittaa, että ryhmän sanat ovat valituilta ominaisuuksiltaan saman- 
laiset eivätkä eroa toisistaan tilastollisesti merkitsevästi. Sanat kuitenkin 
vaihtelevat sanapituuden suhteen, eli ne ovat joko lyhyitä (esim. vaja) tai 
selvästi pidempiä (esim. hevonen). Tarkasteltaessa näiden kahden sana- 
ryhmän tunnistamista keskimääräisen reaktioajan pituuden perusteella 
voidaan todeta, että sanapituus pidentää sanan tunnistusaikaa. Kokeel- 
lisessa asetelmassa tarvitaan siis ainakin kaksi tilannetta: perustilanne 
(engl. control condition) ja koetilanne (engl. experimental condition). Koe- 
tilanteita voi olla enemmänkin kuin yksi. Kokeeseen sisällytetään yleen- 
sä kuitenkin vain vähän koetilanteita, sillä mitä vähemmän koetilanteita 
on, sitä enemmän koeasetelmassa on tilastollista voimaa. 
Kokeenjohtaja pyrkii kokeessaan pitämään kaikki muut kontrolloi- 
tavissa olevat tekijät vakioina, jotta vain riippumattoman muuttujan 
manipulointi erottaa perustilanteen ja koetilanteen. Jotkin kontrolloita- 
vat tekijät liittyvät KH:ihin, kuten kokeessa annettavat ohjeet ja kokeen 
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samanlainen eteneminen kaikilla. Myös koemateriaali täytyy usein ver- 
taistaa: edellä esitetyssä esimerkissä vertaistettiin esimerkiksi kokeessa 
käytettyjen sanojen sanafrekvenssi. 

Vaikka kokeellinen tutkimus kontrolloitaisiin ja vertaistettaisiin huo- 
lellisesti, tulee tulosten tulkinnassa kuitenkin ottaa huomioon se, että 
laboratorio-olosuhteet voivat vaikuttaa tuloksiin. Tutkimuksen tulosten 
ekologinen validiteetti eli se, kuinka hyvin menetelmä pystyy antamaan 
tietoa normaalista kielen prosessoinnista, täytyy arvioida aina tutki- 
muskohtaisesti. Kokeessa tarkasteltavan vaikutuksen tehokas mittaa- 
minen perustuu siihen, että riippuvat muuttujat ovat riittävän tarkkoja 
mittaamaan hypoteesien väitteitä, mutta lisäksi riippuvien muuttujien 
tulee olla riittävän yksinkertaisia. Tällaisia yksinkertaisia muuttujia ovat 
kokeellisessa kielentutkimuksessa mm. reaktioaika, lukemisaika ja 
aivosähkökäyrä. 

Tutkimusasetelmissa on kaksi perustyyppiä: KH:n sisäinen asetelma 
(engl. within-participant design, Hellier 1998) ja KH:iden välinen ase- 
telma (engl. between-participant design, Hampton 1998). KH:n sisäinen 
asetelma tarkoittaa, että KH on itse itsensä verrokki eli kukin KH saa 
sekä perustilanteen että koetilanteen. KH:iden välisessä asetelmassa 
KH-ryhmät ovat eri tilanteissa, joissa toiset saavat koetilanteen ja toiset 
kontrollitilanteen. Tällaisissa koeasetelmissa järjestetään vastabalansoin- 
nilla yleensä asia niin, että kukin KH saa sekä koe- että kontrollitilanteen 
ärsykkeitä mutta nämä vaihtelevat esim. kahdessa ryhmässä. 


Keinoja maksimoida mahdollisuus saada haluttu efekti koeasetelmalla: 


Moukarimenetelmä (engl. sledgehammer approach). Moukarimenetelmäl- 
lä tarkoitetaan sitä, että valitaan riippumaton muuttuja, jonka oletettu 
vaikutus riippumattomaan muuttujaan on mahdollisimman suuri. Tämä 
takaa vahvan koeasetelman. Esimerkiksi edellä esitetyssä koeasetelmassa 
valittiin huomattavasti pidempiä sanoja koetilanteeseen kuin perustilan- 
teeseen, jotta sanojen tunnistamiseen kuluva aika (mitattuna reaktioaikoi- 
na) olisi mahdollisimman erilainen tilanteiden välillä. Tämä ratkaisu lisää 
mahdollisuuksia löytää tilastollisia eroja tarkasteltujen tilanteiden välillä. 
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Otoskoko. Mitä suurempi KH-määrä tutkimuksessa on, sitä suurempi 
mahdollisuus on saada tilastollisesti merkitsevä efekti. Kokeelliset mene- 
telmät ovat usein työläitä, minkä vuoksi tutkimuksen KH-määrät voivat 
kuitenkin joskus olla pienehköjä. Tähän voi vaikuttaa esimerkiksi se, että 
KH-ryhmä(t) täytyy vertaistaa sisäisen variaation kontrolloimiseksi; esi- 
merkiksi KH:iden koulutustaustan pitää olla samanlainen. 


Ryhmän sisäisen variaation kontrollointi. Haasteena voi olla otoksen 
edustavuus eli se, kuinka hyvin valittu ryhmä edustaa tiettyä yhteiskun- 
nan yhteisöä. Esimerkiksi yliopisto-opiskelijat ovat hyvä ryhmä saman- 
kaltaisuuden kannalta mutta haasteellinen edustavuuden näkökulmas- 
ta, sillä voi olla, että opiskelijat suoriutuvat tehtävästä paremmin kuin 
ihmiset keskimäärin. Ryhmän sisäistä variaatiota voi siis kontrolloida 
valikoimalla ryhmä jostakin tietystä yhteiskunnan yhteisöstä. Ryhmän 
valinta vaikuttaa tulosten yleistämiseen, joten ryhmä olisi hyvä valita sen 
mukaan, mikä tutkimuksen tavoite on. 


Riippuvan muuttujan valinta. Riippuvan muuttujan herkkyys ilmaista 
haluttua efektiä tulee varmistaa: esim. reaktioaika on virhemäärää her- 
kempi ilmaisemaan prosessoinnin vaikeutta sanantunnistustehtävissä. 


Koetilanteiden määrä. Kokeeseen sisällytetään vain vähän koetilanteita, 
sillä mitä vähemmän koetilanteita on, sitä enemmän koeasetelmassa on 
tilastollista voimaa. 


Tutkimuksen eettisyys on keskeistä psyko- ja neurolingvistiikan tutki- 
muksessa (tarkemmin kielentutkimuksen etiikasta ks. Johdannon luku 
4 tk.). Tutkijan tulee luonnollisesti myös taata KH:iden anonyymiys 


sekä tutkimuksen raportoinnissa että aineiston säilytyksessä. Erityisesti 
neurolingvistiikassa tutkitaan usein potilasryhmiä, joita koskevat tar- 
kemmat tutkimuseettiset säännöt sekä potilaslain asettamat vaatimuk- 
set. Tällöin tutkimukseen hankitaan tutkimuslupa sekä yliopiston omal- 
ta että alueen sairaanhoitopiirin eettiseltä neuvostolta. 
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3.2. Kokeellisen kielentutkimuksen eteneminen 


Kokeellinen tutkimus koostuu tyypillisesti seuraavista vaiheista: tut- 
kimusaiheen valinta ja taustoitus, koeasetelman hahmottelu ja hypo- 
teesien muodostaminen, ärsykevalinta, koeasetelman tekninen ko- 
koaminen ja kokeen pilotointi, kokeiden ajo ja datan siivous, tulosten 
tilastollinen tarkastelu sekä tulosten julkaiseminen. Käsittelemme seu- 
raavassa kutakin vaihetta erikseen. 

Tutkimusaiheen valinta ja taustoitus. Kokeellinen tutkimus alkaa tut- 
kimusaiheen valinnalla. Tutkimusaiheesta kiinnostuminen voi tapah- 
tua eri tavoin. Kokeneempi tutkija voi esitellä aihetta ja siihen liittyvää 
asiaa, konferenssiesitelmä voi antaa ideoita tutkimusaiheeksi, artikkelia 
lukiessa tulee idea tutkimusaiheesta, toinen tutkija ehdottaa yhteistyö- 
tä aiheen tutkimisessa, kollega voi lähettää aihetta käsittelevän tai sitä 
sivuavan artikkelin sähköpostilla tai aihe voi sisältyä kokeneen tutkijan 
rahoitettuun tutkimusprojektiin, johon nuori tutkija pääsee mukaan. 
Kun aihe on alustavasti valittu, pitää selvittää, onko aihetta tai aihepiiriä 
tutkittu aiemmin. Tässä vaiheessa haetaan internetistä tai aihepiirin kes- 
keisistä artikkeleista tietoa siitä, onko kyseistä aihetta tutkittu, ja jos on, 
millaisilla menetelmillä. Oikeiden avainsanojen käyttö auttaa löytämään 
relevantit artikkelit. 

Koeasetelman hahmottelu ja hypoteesien muodostaminen. Kun tut- 
kimuksen aihe on valittu ja aiheeseen tutustuttu, on aika hahmotella 
koeasetelmaa: miten aihetta tarkastellaan ja miten koetilanteita voidaan 
manipuloida. Toisin sanoen pohditaan, millaisia eri tilanteita koeasetel- 
man pitäisi sisältää, jotta aihetta ja sen vaikutuksia kielenprosessointiin 
voitaisiin tutkia mahdollisimman yksiselitteisesti. Jos aihetta tutkitaan 
ensimmäistä kertaa, on parasta tehdä mahdollisimman vahva mani- 
pulointi eli ns. moukariasetelma. Jos halutaan tutkia esimerkiksi sitä, 
missä määrin sanapituus vaikuttaa prosessointiin, lyhyiden ja pitkien 
sanojen eroksi valitaan monta kirjainta, ei vain yhtä tai kahta. Hypoteesi 
muodostetaan yleensä aiemman tutkimustiedon pohjalta: se on tutki- 
jan ehdottama selitys tutkittavalle ilmiölle. Ilman hypoteesia tutkimus 
on tyhjän päällä, eivätkä tutkimuksen tulokset tällöin oikeastaan kerro 
mitään. Kokeellisessa tutkimuksessa hypoteesin tulee olla sellainen, että 
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sitä voidaan testata kokeellisesti. Hypoteesi voi joko saada vahvistavaa 
näyttöä tuekseen tai osoittautua vääräksi. Nollahypoteesi on esimerkiksi 
se, että kahden tarkasteltavan tilanteen välillä ei ole eroa. Hypoteeseista 
on myös hyvä keskustella kollegan tai kollegoiden kanssa, sillä joskus 
aihe on niin innostava, että oma ajattelu voi olla vinoutunut, ja on hyvä 
kuulla ulkopuolisen näkemyksiä aiheen tutkimisesta ja hypoteesien täs- 
mällisyydestä. Myös koemenetelmä valitaan tässä vaiheessa, jos se ei 
ole selvä esimerkiksi hypoteesin luonteen vuoksi. Menetelmä voi olla 
esimerkiksi silmänliikemittaus. 

Ärsykevalinta. Kun hypoteesit on muodostettu ja koeasetelma sel- 
vitetty, alkaa kokeellisen kielentutkimuksen tyypillisesti aikaa vievin ja 
tärkein osuus eli ärsykemateriaalin valinta ja vertaistus. Kokeen aikana 
ilmestyneisiin vaikeuksiin voidaan reagoida, mutta huonosta ärsyke- 
valinnasta ei pelasta mikään. Tyypillinen aloittelevan kokeentekijän vir- 
he on tarkkuuden puute, joka ilmenee yleensä siten, että aikapaineessa 
koemateriaalin kerääjä ei malta olla riittävän huolellinen ja perinpohjai- 
nen ärsykevalinnassa. Usein syy tähän on, että kokeentekijää avustava 
kokenut tutkija ei ole riittävästi korostanut huolellisuuden merkitystä 
ja opastanut ärsykevalinnan koukeroissa. Toinen yleinen virhe on, että 
kokematon tutkija pyrkii liittämään koeasetelmaan liian monta hypotee- 
sia, jolloin seurauksena on liian pieni määrä ärsykkeitä kutakin hypo- 
teesia kohden. Tällainen tilanteiden vähäisyys heikentää tulosanalyysien 
tilastollista voimaa, jolloin mahdollisuus halutun efektin todentamiseen 
vähenee. Nyrkkisääntönä voi pitää sitä, että on parempi tehdä useita 
kokeita kuin pyrkiä tekemään kaikki mahdollinen yhdellä kertaa. Näin 
on siksi, että jos ärsykkeitä on riittävästi kokeen moniin hypoteeseihin, 
niin koe on todennäköisesti pitkä ja raskas sekä kokeenjohtajalle että 
erityisesti KH:ille. KH:iden väsyminen ei ole toivottavaa, koska väsymys 
vaikuttaa herkästi suoritukseen. 

On tärkeää huomata myös se, että jo ärsykevalintaa tehtäessä tutkijalla 
pitää olla käsitys siitä, miten tuloksia analysoidaan tilastollisesti. Tarkaste- 
lutapa vaikuttaa nimittäin siihen, miten ärsykeaineisto koostetaan. Psyko- 
lingvistiikan viitekehyksessä voidaan esittää laadullisia tutkimustuloksia, 
mutta edustamamme kokeellinen kielentutkimus on pääasiallisesti mää- 
rällistä eli kvantitatiivista tutkimusta, jossa ilmiö joko on tai ei ole sen 
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mukaan, saadaanko tilastollisesti merkitsevä tulos. Toisin sanoen pelkkä 
ero tilanteiden välillä ei merkitse mitään, jos se ei ole tilastollisesti mer- 
kitsevä. Laadullinen tarkastelu voi kuitenkin joskus olla tarpeen, esimer- 
kiksi koeasetelmaa suunnitellessa. Jos esimerkiksi haluaa tutkia parti- 
siippien prosessointia, pitää selvittää sekä se, millaiset sanat määritellään 
partisiipeiksi, että se, millaisissa tilanteissa partisiippi on leksikaalistunut 
adjektiiviksi. Näitä ei voida määrällisellä tarkastelulla selvittää. 

Koeasetelman tekninen kokoaminen ja kokeen pilotointi. Ärsyke- 
valinnan jälkeen on vuorossa koeasetelman tekninen toteutus ja kokeen 
pilotointi. Tässä vaiheessa koelaitteistoon säädetään oikeat asetukset ja 
lisätään ärsykeaineisto sekä tarkistetaan koeohjelma. Helpoimmillaan 
ohjelmointia ei tarvitse muuttaa, vaan laitteiston säätöjen muuttaminen 
riittää, mutta koeasetelma voi myös edellyttää aivan uudenlaista ohjel- 
maa. Joskus jotakin kokeen osaa täytyy testata, jotta varmistetaan, että 
ohjelma toimii halutusti. Kun kaikki on kohdallaan, tehdään testiajot 
eli koe pilotoidaan. Pilottivaiheessa testataan muutamia KH:itä, joiden 
tuloksia ei kuitenkaan oteta mukaan varsinaiseen analyysiin. Muuta- 
man testin jälkeen tiedetään, toimiiko ohjelma halutusti, ja jos näin on, 
tarkastellaan tulostiedostoja, jotta nähdään, onko tarpeellinen data tal- 
lentunut. Jos kaikki on hyvin, edetään varsinaisen kokeen ajoon. Tässä 
vaiheessa rekrytoidaan tarvittavat KH:t kokeeseen. 

Kokeiden ajo ja datan siivous. Kun koeasetelma on testattu ja todet- 
tu toimivaksi, voidaan siirtyä tutkimuksen varsinaiseen testausvaihee- 
seen eli kokeiden ajoon. Testausvaiheessa testataan etukäteen sovittu 
määrä KH:itä, minkä jälkeen siivotaan eli poistetaan virheellinen data, 
kuten häiriöt silmänliikekameran rekisteröinnissä laitteiston toimiessa 
muuten normaalisti. Tässä yhteydessä — asetelmasta riippuen — voidaan 
tarvittaessa poistaa myös tilastollisin kriteerein poikkeavat havainnot, 
esimerkiksi arvot, jotka poikkeavat yli kolme keskihajontaa kyseisen 
datan keskiarvosta. Tällä siivouksella saadaan data yhtenäiseksi, jolloin 
poikkeukselliset tulokset eivät vinouta tai peitä tuloksia. 

Tulosten tilastollinen tarkastelu. Tulokset käsitellään tilastollisesti. 
Tässä luvussa ei tarkastella tilastollisia menetelmiä, koska niistä on kir- 
joitettu laajasti muualla (ks. esim. Nummenmaa 2009; Grönroos 2008; 
myös Määrällinen korpuslingvistiikka tk.). Mainittakoon, että tyypillinen 
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kokeellisen kielentutkimuksen datan tilastollinen tarkastelutapa on ollut 
varianssianalyysi (ANOVA), mutta nykyään dataa tarkastellaan eneneväs- 
sä määrin monitasomallinnuksella (engl. linear-mixed-modelling). 

Tulosten julkaiseminen. Kun varsinainen tutkimus on tehty, on aika 
raportoida tulokset. Koeasetelmia selostava tieteellinen artikkeli on 
tekstilajina yleensä määrämuotoinen: siihen kuuluu tyypillisesti johdan- 
to, teoreettisen taustan esittely, metodiosuus, tulokset, pohdinta ja pää- 
telmät. Kirjoittamisprosessiin kuitenkin vaikuttaa olennaisesti, mihin 
julkaisuun käsikirjoitus lähetetään, koska eri julkaisujen kirjoitusohjeet 
vaihtelevat esim. viittaustavan, rakenteen ja sanamäärän suhteen. Lähes 
poikkeuksetta kokeellisen kielentutkimuksen raportointi aloitetaan me- 
todiosuudesta, jossa kuvataan tutkimusaineisto sekä esitellään KH:t ja 
koeasetelma. Tämän jälkeen kirjoitetaan auki tulokset. Lopuksi voi siir- 
tyä esittelyosuuteen (engl. Introduction) ja pohdintaan (engl. Discussion, 
General Discussion). Joissakin julkaisuissa vedetään yhteen tulokset ja 
niiden implikaatiot vielä lyhyesti päätelmät-osiossa (engl. Conclusions). 
Tieteellisen artikkelin kaksi tärkeää tekijää ovat lisäksi abstrakti ja avain- 
sanat (engl. keywords). Ne vaikuttavat mitä suurimmassa määrin siihen, 
kuinka monet lukevat artikkelin ja kuinka paljon siihen viitataan muissa 
tutkimuksissa. 


3.3. Kokeellisen kielentutkimuksen menetelmiä 


Kokeellisen tutkimuksen menetelmät voidaan jaotella esimerkiksi mo- 
daliteetin, suoritustavan tai tarkasteltavan populaation mukaan. Mo- 
daliteetilla viitataan siihen, minkä aistin varassa tutkimuksen tehtävä 
tehdään. Suoritustavan mukaista jaottelua kuvataan englanninkielisessä 
kirjallisuudessa jakamalla menetelmät online- ja offline-menetelmiin: 
online-menetelmillä viitataan kielenprosessoinnin tarkasteluun reaali- 
ajassa, ofline-menetelmillä tarkastellaan kielenprosessointia ei-ajallisesti, 
esimerkiksi tarkkuuden tai virheiden näkökulmasta. Populaatioista 
kokeellisessa tutkimuksessa tarkastellaan pääasiassa ryhmiä, mutta 
2000-luvulla myös kokeelliset yksittäistapaustutkimukset (engl. single 
study experimental design, SSED) ovat yleistyneet. 
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3.3.1. RYH MA- JA TAPAUSTUTKIMUS 

Kokeellinen ryhmätutkimus. Kokeellisessa ryhmätutkimuksessa tar- 
kastellaan tietyn ryhmän kielellistä ja usein myös kognitiivista suoriu- 
tumista suhteessa terveistä verrokkihenkilöistä koostuvaan ryhmään. 
Verrokkiryhmän tulee vastata KH-ryhmää taustamuuttujiltaan (mm. 
ikä, sukupuoli, koulutus) tarkasti. Neurolingvistiikassa tarkastellaan 
pääasiassa patologisia ryhmiä, esim. henkilöitä, joilla on afasia tai jo- 
kin kehityksellinen kielihäiriö. Kokeellisen kielentutkimuksen piirissä 
tutkitaan myös paljon toisen kielen oppijoita, esimerkiksi sitä, miten 
L2-puhujien kielitaito eroaa L1-puhujista. Ryhmätutkimuksissa mo- 
lemmat ryhmät osallistuvat tutkimuskysymyksen perusteella valittui- 
hin kielellisiin ja mahdollisesti kognitiivisiin testeihin. Näiden testien 
vastauksia verrataan ryhmätasolla, eli ryhmätutkimuksissa ei yleensä 
kiinnitetä huomiota ryhmän sisällä esiintyvään yksilölliseen vaihteluun. 
Ryhmätasoista tarkastelua on myös kritisoitu, ja nykyään myös ryhmien 
sisäistä vaihtelua raportoidaan enemmän tutkimuksissa. Koska tuloksia 
kuitenkin tarkastellaan pääasiassa ryhmätasolla, täytyy tutkimuksen ryh- 
mien olla suurehkoja (15-100 KH:ä per ryhmä), koska ryhmiä vertaillaan 
useimmiten tilastollisesti. 

Kokeellinen tapaustutkimus. Tapaustutkimuksessa tarkastellaan 
yhden tai muutaman KH:n tiettyä kielellistä käyttäytymistä syvemmin 
kuin ryhmätason tutkimuksissa (ks. tarkemmin Beeson & Robey 2006; 
Byiers, Reichle & Symons 2012). Tarkastelu on usein laadullisempaa, 
koska KH:itä on vain muutama. Tämä lähestymistapa sopii erityisen hy- 
vin tapauksiin, joita esiintyy hyvin vähän (esimerkiksi monikieliset afaa- 
tikot). Usein tapaustutkimukset ovat kuvailevia, mutta tapaustutkimus 
voi olla myös kokeellinen, jos tarkastellaan esimerkiksi jonkin tietyn 
intervention vaikutusta KH:n kieleen. Joskus tapaustutkimuksissa ver- 
taillaan yhden tai kahden KH:n kielellisiä tai kognitiivisia tuloksia ver- 
taistettuun verrokkiryhmään. Verrokkiryhmä on tarpeellinen erityisesti 
silloin, kun käytettyjen testien tuloksista tarkastellaan reaktioaikoja tai 
muita aikaan sidottuja arvoja. 
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3.3.2. OFFLINE-MENETELMIA 
Offline-menetelmilla tarkastellaan kielenprosessointia ei-ajallisesti. 
Niiden avulla voidaan selvittää esimerkiksi KH:iden kielen tuottamis- 
ta, arvioita esimerkiksi lauseen luonnollisuudesta tai kieliopillisuudes- 
ta tai kielellistä muistia. Keskeistä offline-menetelmissä on, että niissä 
ei tarkastella KH:iden tuotoksen kestoa. Ajankäyttö voi kuitenkin olla 
tehtävässä rajattu. Online-kokeissa käytettävää materiaalia pilotoidaan 
usein teettämällä offline-testeja, joissa tarkastellaan esimerkiksi kokees- 
sa käytettävien lauseiden semanttisia ominaisuuksia ja lauseiden luon- 


tevuutta. Pyrkimyksenä on saada mahdollisimman hyvin vertaistettuja 
aineistoja kokeellista tutkimusta varten tai saada tarkkaa tietoa esim. 
siitä, miten hyvin luettu teksti muistetaan lukemisen jälkeen. Offline- 
menetelmien tehtävätyyppejä esitellään taulukossa 1. 


Yksittäisten 
sanojen normitus 


Tässä tehtävätyypissä KH:t arvioivat tyypillisesti sanojen omi- 
naisuuksia, kuten tuttuutta, konkreettisuutta, kuviteltavuutta, 
edustavuutta ja tyypillisyyttä/prototyyppisyyttä. 


Assosiaatiotehtävät 


Assosiaatiotehtävissä KH:t arvioivat, kuinka hyvin jotkin sanat 
tai lauseenosat sopivat yhteen. 


Tuottotehtävät Tuottotehtävissä KH:t joko puhuvat tai kirjoittavat. Tuottoa 
voidaan ohjailla (esim. ”tuota sopiva substantiivi”) tai siinä 
voidaan käyttää vapaata assosiaatiota (esim. ”tuota viisi ensim- 
mäistä mieleesi tulevaa sanaa”). 

Arviointitehtävät Arviointitehtävissä KH:t arvioivat annetun esimerkin erilaisia 


piirteitä, esimerkiksi lauseen luonnollisuutta määrätyllä asteikol- 
la tai sitä, miten hyvin lauseen viimeinen sana sopii edeltävään 
osuuteen. 


Muistamistehtävät 


Muistamistehtäviä on kaksi pääversiota: välitön ja viivästetty. 
KH:itä pyydetään esimerkiksi tuottamaan tiivistelmä juuri lue- 
tusta tarinasta, tai heitä pyydetään tiivistämään tarina viikon 
kuluttua tarinan lukemisesta. 


Taulukko 1. Offline-menetelmien tehtävätyyppejä. 
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3.3.3. ONLINE-MENETELMIA 

Online-menetelmilla tarkastellaan KH:n varsinaista suoritusta. Suorituk- 
sen (esim. suoritusajan) mittauksen kaksi pääsuuntausta ovat reaktio- 
aikaan liittyvät menetelmät ja jatkuvan mittauksen menetelmät. Reaktio- 
aikamenetelmillä saadaan yksi mittauspiste. Jatkuvan mittauksen 
menetelmillä voidaan puolestaan tarkastella KH:n toimintaa prosessina. 


Reaktioaikamenetelmiä 


Visuaalinen sanantunnistus. Visuaalinen sanantunnistus (engl. visual 
word recognition), toiselta nimeltään leksikaalisen päätöksenteon tehtävä 
(engl. visual lexical decision), on yleisin ja käytetyin reaktioaikamenetel- 
mä. KH:n tehtävä on tunnistaa tietokonekuvaruudulta mahdollisimman 
nopeasti ja tarkasti, onko kulloinkin kuvaruudulle tuleva sana tutkitta- 
vana oleva kielen sana vai ei. Ärsykkeinä käytetään tällöin tietyn kielen 
sanoja (esim. tulppa) ja saman kielen fonotaksin mukaisia epäsanoja 
(esim. *talppa). Tyypillisesti tämän tehtävän avulla tutkitaan jotakin kie- 
len yleistä piirrettä (esim. morfologista monimutkaisuutta), jonka vai- 
kutuksia reaktioaikanopeuteen halutaan selvittää. Perusajatuksena on, 
että mitä kauemmin reaktio kestää, sitä vaativammasta prosessoinnista 
on kyse. Tämän kuten muidenkin reaktioaikamenetelmien ongelmana 
on ns. ekologinen validiteetti: voidaanko tuloksia yleistää arkielämään? 

Auditiivinen sanantunnistus. Auditiivinen sanantunnistus (engl. 
auditive word recognition, perceptual identification) on kuuloon perustuva 
sanantunnistusmenetelmä, jossa KH kuulee sanoja yksi kerrallaan ja 
hänen tehtävänsä on tunnistaa kukin sana niin tarkasti kuin mahdollis- 
ta. Asetelman vaikeusasteen lisäämiseksi ärsykkeiden kuulemista häi- 
ritään joskus taustahälyllä, joka voi olla puheen kaltaista tai muunlaista 
ääntä. 

Nimeäminen. Nimeäminen (engl. naming) tarkoittaa asetelmaa, jos- 
sa KH:n pitää mahdollisimman nopeasti toistaa ääneen tietokoneen 
kuvaruudulla kulloinkin näkyvä sana tai nimetä ruudulla näkyvä kuva. 
Menetelmällä pyritään saamaan tietoa sanantunnistuksen alkuvaiheen 
ilmiöistä. Metodilla on kolme vaikeasti ratkaistavaa erityisongelmaa, joi- 
ta muilla reaktioaikamenetelmillä ei ole. Ensinnäkin toisto on usein no- 
peampaa kuin ymmärtäminen, joten jos sana on pitkä, henkilö aloittaa 
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ääntämisen ennen kuin hän on lukenut koko sanan. Tämä on ongelma 
erityisesti suomessa, jossa sanat ovat usein pitempiä kuin esimerkik- 
si englannissa. Toiseksi sananalun suhteellinen vaikeus pidentää ään- 


tämisen aloittamisaikaa (ks. Kokeellinen fonetiikka tk.). Kolmanneksi 
ääntämisen mittauspisteen aloituskohta ei ole yksiselitteinen, vaikka 
tyypillisesti käytetäänkin ääntämisen alkamishetkeä (määriteltynä esi- 
merkiksi akustisen tarkastelun perusteella). Esimerkiksi ääntäminen 
voi hidastua loppuosassa. Vaikka kahden vertailtavan sanan ääntämisen 
alkamiskohta on teoriassa sama, käytännössä KH:t voivat tuottaa sano- 
jen alkuja eri nopeuksilla. 

Heräteasetelma. Heräteasetelma (engl. priming) on asetelma, jossa 
halutaan saada selville herätteen (engl. prime) ja kohteen (engl. target) 
välisen suhteen läheisyys. Herätteellä tarkoitetaan ärsykettä, joka vai- 
kuttaa seuraavaan ärsykkeeseen vastaamiseen tiedostamattomasti. Jos 
tietokoneen kuvaruudulla esitetään esimerkiksi sana kissa tai kana, 
kissa-sanan jälkeen esitettynä kohdesana koira on nopeampi tunnistaa 
kuin kana-sanan jälkeen esitettynä. Ajatuksena on, että kohdesanaan 
liittyvän herätteen tunnistaminen aktivoi semanttisen kentän mutta 
kohdesanaan liittymätön tai vain kaukaisesti liittyvä sana ei aiheuta sa- 
manlaista kohdesanan tunnistuksen helpottumista (engl. facilitation). 
Heräteasetelmalla voidaan tutkia myös eri aistien välistä herätevaiku- 
tusta (engl. intermodal priming). Tyypillisimmät asetelmat ovat joko vi- 
suaalinen heräte ja visuaalinen kohde tai auditiivinen heräte ja visuaa- 
linen kohde. Kaikille reaktioaikamenetelmille on yhteistä, että niissä 
voidaan käyttää myös niin sanottua vastaa-älä vastaa -versiota (go/no-go), 
jolla pystytään vaikuttamaan KH:n vastaamistapaan. Vastaa-älä vastaa 
-versiossa KH:n tehtävänä on reagoida vain ennalta määrätyn tyyppisiin 
ärsykkeisiin, esim. vain oikeisiin sanoihin, kun tehtävässä esitetään oi- 
keita sanoja ja epäsanoja. Erityisesti heräteasetelmissa on tällä versiolla 
joskus varsin suuri merkitys. 

Yleisesti voidaan todeta, että reaktioaikamenetelmien etuina ovat ase- 
telman ja koesarjan tulosten saannin helppous ja laitteiston helppo saa- 
tavuus. Haasteena on tulosten suhde normaaliin kielenprosessointiin: 
kertooko hitaampi reaktioaika todellakin siitä, että prosessointi on han- 
kalampaa? Sanan yleisyys on kuitenkin merkittävimpiä reaktionopeutta 
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lisääviä tekijöitä, mikä antaa loogisen perusteen reaktioajan käyttöön 
prosessoinnin vaativuuden mittarina. 


Jatkuvan mittauksen menetelmiä 


Kokeellisessa kielentutkimuksessa käytetään sekä silmänliikemittausta 
että aivokuvantamisen menetelmiä. Seuraavaksi esitellään näitä jatku- 
van mittauksen menetelmiä. 

Silmänliikemittaus. Silmänliikemittauksessa rekisteröidään KH:n 
silmänliikkeitä suhteessa ärsykkeeseen. Silmänliikkeiden oletetaan ker- 
tovan KH:n tietyn tehtävän monimutkaisuudesta ja sen edellyttämästä 
prosessoinnista. Silmänliikkeiden rekisteröinti perustuu siihen, että sil- 
mät hypähtelevät ja pysähtelevät lukiessa tai mitä tahansa katsellessa. 
Nämä pysähdysajat ja -kohdat pystytään tietokoneistetulla silmänliike- 
kameralla (engl. eye tracker) mittaamaan ja rekisteröimään myöhempää 
analyysia varten. Silmänliikemittauksessa käytettävä laitteisto koostuu 
kahdesta tietokoneesta, jotka on yhdistetty toisiinsa ja kahteen pieneen 
infrapunakameraan. Kuva 1 alla havainnollistaa KH:n näkymän tyypilli- 
sessä tekstin prosessoinnin koeasetelmassa. 


Kuva 1. Silmänliikemittaus (julkaistu SR Research Ltd:n luvalla). 
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Lukemisen silmänliiketutkimus perustuu kahteen yleiseen periaat- 
teeseen. Ensimmäisen periaatteen mukaan prosessointiin vaikuttaa koh- 
teen kompleksisuus tai muu hankaloittava ominaisuus: prosessoimme 
jotakin kielen rakennetta sitä kauemmin, mitä vaikeampi se on. Esimer- 
kiksi lauseke luetaan nopeammin sivulauserakenteessa kuin konverbi- 
rakenteessa (Äiti ajoi nurmikkoa, kun isä hinkkasi auton konepeltiä vs. 
Äiti ajoi nurmikkoa isän hinkatessa auton konepeltiä). Toisen periaatteen 
eli niin sanotun silmä-mielihypoteesin (engl. eye-mind hypothesis) mu- 
kaan sanojen prosessointi ja lukeminen ovat käytännössä sama asia. 
Viitatuin ja samalla kritisoiduin versio tästä periaatteesta on Justin ja 
Carpenterin (1980) niin sanottu välittömyyshypoteesi (engl. immediacy 
hypothesis). Tämän äärimmäisen tulkinnan mukaan sanan prosessointi 
alkaa heti sen lukemisen alkaessa ja loppuu heti, kun sanan lukeminen 
loppuu. Se että sanan prosessointi loppuu lukemisen loppumiseen, on 
kuitenkin osoitettu vääräksi. Rayner ja Duffy (1986) osoittivat ensim- 
mäisinä niin sanotun valumisefektin (engl. spill over effect) ja viivästetyn 
efektin (engl. delayed effect). Valumisefektillä tarkoitetaan tilannetta, jossa 
kohdealueen prosessoinnin hidastumisen ohella myös kohdealueen jäl- 
keinen rakenne prosessoidaan hitaammin, eli efekti ikään kuin valuu 
yli. Viivästetyssä efektissä prosessoinnin vaikeus ei ilmene heti kyseisen 
rakenteen lukemiseen käytetyssä ajassa vaan vasta sitä seuraavan ra- 
kenteen lukemisessa. Välittömyyshypoteesiin nähden toiseen suuntaan 
äärimmäinen tulkinta prosessoinnista lähtee siitä, että monet kielen 
tekijät, kuten kongruenssi, eivät vaikuta varsinaiseen lukemiseen vaan 
niitä käytetään vasta jonkinlaisena tarkistusjärjestelmänä (engl. back up 
procedure, Nicol, Forster & Veres 1997). 

Jos luettava lause on hankala prosessoida, lukeminen hidastuu. Tut- 
kimuksessa tarkastellaan tyypillisesti, vaikuttaako tutkittava ilmiö lu- 
kemisen nopeuteen. Lukemisen hidastuminen voidaan jakaa erilaisiin 
alaryhmiin. Näitä ovat tarve hidastaa lukemista vaikeassa kohdassa, tarve 
hidastaa lukemista hankalan kohdan jälkeisessä rakenteessa tai tarve pa- 
lata aiempiin kohtiin tekstissä. Luettava kohta voi käsittää mitä tahansa 
sanan osasta kokonaiseen kappaleeseen. 

Yleensä lukemisen vaikeus ilmaistaan alan teknisiä käsitteitä käyt- 
täen, jolloin keskeisenä viitekehyksenä on tapahtumien ajallinen 
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jatkumo. Tutkittavan alueen ensimmäinen fiksaatio eli ensimmäinen 
silmäys (engl. first fixation) on lyhytaikaisin havaittavissa oleva luke- 
misen vaativuuden muuttuja. Ensimmäinen silmäys tarkoittaa sitä lu- 
kemisaikaa, jonka KH:n ensimmäinen silmäys kestää. Ajallisesti seu- 
raava muuttuja on kohdealueen ensimmäinen lukeminen (engl. first 
pass reading, gaze duration). Tämä on kaikkein keskeisin suure, ja sillä 
tarkoitetaan aikaa, jonka KH käyttää kohdealueen lukemiseen ennen 
siirtymistään tekstissä joko eteenpäin seuraaviin sanoihin tai taaksepäin 
aiempiin sanoihin. Edellä mainitut valumisefekti ja viivästetty efekti ovat 
mahdollisia eroja kohdealueen jälkeisen rakenteen lukemisessa, ja ne 
ovat usein aikajanan seuraavia muuttujia. Useimmiten ajallisesti viimei- 
nen muuttuja on kohdealueen uudelleenlukeminen (engl. regression, 
rereading), joka sisältää kaiken sen kohdealueen lukemisen, joka tapah- 
tuu ensimmäisen lukemiskerran jälkeen. Uudelleenlukemisen yhtey- 
dessä käytetään mittarina usein myös uudelleenlukemisen todennäköi- 
syyttä (engl. probability for regression). Mikäli tätä muuttujaa käytetään, 
voi muuttuja olla myös kohdealueen kokonaislukemisaika (engl. total 
fixation time), jolla tarkoitetaan kohdealueeseen kohdistuvaa yhteenlas- 
kettua lukemisaikaa. Näiden pääosin ajallisten muuttujien lisäksi myös 
fiksaation sijaintia voi tarkastella. Tällöin tarkastellaan yleensä toisaalta 
sanan ensimmäisen fiksaation sijaintia ja sitä edeltävän silmänliikkeen 
(engl. saccade) lähtöpaikkaa, joista saa laskettua sakkadin eli fiksaatiosta 
toiseen siirtyvän nopean silmänliikkeen pituuden (ks. kuvio 1). Kuviossa 
1 uudelleenlukemiset on selvyyden vuoksi esitetty tekstin yläpuolella ja 
merkitty nuolilla. 


zonas 


aC ED perusteella een aitioon a M 
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— Oe 
tunut ryhmä nautti kovasti toistensa seurasta. 
€ + 25 $ 9 


Kuvio 1. Silmänliikkeiden rekisteröinnissä käytetyt suureet (Vainio 2006; julkaistu 
Puhe ja Kieli -lehden luvalla). 
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Menetelmän etuna on, että KH:n tehtävä on luonnollinen: KH vain 
lukee lauseita tai tekstiä kuvaruudulta samalla, kun hänen silmänliik- 
keensä rekisteröidään. Toisin sanoen KH ei joudu tekemään mitään 
keinotekoista, vaan hän lukee kuten muutoinkin lukisi. Tällä perusteella 
saatuja tuloksia voidaan käyttää argumentoinnissa melko hyvin. Tutki- 
muksen onnistumiseen kuitenkin vaikuttaa olennaisesti, miten katseen 
kulloinenkin kohde vastaa prosessoinnin kohdetta ja kuinka hyvin ko- 
keiden ärsykemateriaalit on vertaistettu. 

Funktionaalinen magneettikuvantaminen (fMRI). Magneettikuvanta- 
minen (engl. magnetic resonance imaging) on pääasiassa aivojen raken- 
teiden staattinen kuvantamismenetelmä. Magneettikuvantaminen pe- 
rustuu vesimolekyylien atomiydinten magneettiseen toimintaan. Tämä 
saadaan aikaan luomalla ulkoinen magneettikenttä, jolloin vesimole- 
kyylien atomit järjestäytyvät linjaan. MRI-kuvat luodaan matemaattisen 
kaavan avulla kolmiulotteisiksi kuviksi aivoista. Koska MRI-kuvat perus- 
tuvat verenkiertoon, niiden temporaalinen resoluutio ei ole kovin tark- 
ka. Tekniikan hyvä puoli on korkea spatiaalinen (eli sijaintiin liittyvä) 
resoluutio, eli aktivaatiota aivoissa voidaan tarkastella jopa millimetrin 
tarkkuudella. MRI-tekniikka on ei-invasiivinen, eli KH ei tutkimuk- 
sessa altistu mahdollisesti kehoa vahingoittaville toimenpiteille, koska 
kuvantamistekniikka perustuu magneettikenttiin. Kokeellisessa kielen- 
tutkimuksessa käytetään funktionaalista magneettikuvantamista, jolloin 
aivojen toimintaa voidaan tarkastella kielen prosessoinnin aikana. 

Magneettienkefalografia (MEG). Magneettienkefalografia (engl. 
magnetoencephalography) mittaa aivojen sähköisen toiminnan tuottamia 
magneettikenttiä. MEG:n spatiaalinen resoluutio on korkea, ja myös sen 
temporaalinen resoluutio on tarkempi kuin fMRI:llä. MEG on menetel- 
mänä täysin ei-invasiivinen, koska siinä ei käytetä radioaktiivisia ainei- 
ta, ja se mittaa hermoston toimintaa suoremmin kuin tarkastelemalla 
aineenvaihduntaa tai verenkiertoa. Magneettikenttiin perustuva MEG 
sopii erityisen hyvin yksittäisten KH:iden ja yksilöllisen variaation tar- 
kasteluun, koska se ei vaadi ryhmän sisällä tehtävää keskiarvoistamista. 

Flektroenkefalografia (EEG). Elektroenkefalografialla (engl. 
electroencephalography) mitataan aivosolujen tuottamaa sähköis- 
tä toimintaa. EEG-mittauksessa tarkastellaan kahden pisteen välisiä 
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sähköpotentiaalien eli aivoaaltojen eroja. Päänahalle asetetaan elektro- 
deja, jotka mittaavat aivokuoren hermosolujen sähköistä toimintaa eri 
aivopuoliskoissa ja aivolohkoissa. Mitattu sähköinen toiminta esitetään 
usein visuaalisesti, ja eri alueiden toimintaa verrataan toisiinsa. 
Herätepotentiaalit (ERP). Herätepotentiaaleilla eli herätevasteilla (engl. 
event-related potentials) viitataan sähköiseen toimintaan, joka syntyy, kun 
keskushermosto reagoi tiettyyn sensoriseen ärsykkeeseen. Nämä poten- 
tiaalit ovat suhteellisen pieniä (1-5 mikrovolttia), ja ne rekisteröidään 
elektrodeilla samoin kuin EEG:tà mitattaessa. Koska potentiaalit ovat hy- 
vin pieniä, FRP-mittauksessa lasketaan useiden saman ärsykkeen aiheut- 
tamien potentiaalien keskiarvoja. Näin saadaan suodatettua pois häiriöi- 
tä, kuten taustamelua. ERP on tyypillisesti sarja positiivisia ja negatiivisia 
huippuja, jotka heijastavat varhaisia tai myöhäisiä informaation proses- 
soinnin eli tiedonkäsittelyn vaiheita (ks. kuvio 2). Negatiiviset huiput 
merkitään kirjaimella N ja positiiviset huiput kirjaimella P. Kirjaimeen 
liitetään numero millisekunneissa, joka kuvastaa aikaa ärsykkeen esittä- 
misestä, esimerkiksi N400 tai P600. Huippuihin voidaan viitata myös 
järjestysnumeroilla, esim. Ni tai P3, alkaen ärsykkeen esittämishetkestä. 
Lisäksi on huomattava, että alan artikkeleissa käytetyissä kuvaajissa on 
usein negatiiviset arvot yläpuolella ja positiiviset arvot alapuolella. 
Suhteessa muihin aivojen kuvantamismenetelmiin ERP:n käyttö 
neurolingvistisessä tutkimuksessa on hyödyllistä, koska menetelmä on 
edullinen eikä se ole invasiivista. Menetelmän spatiaalinen resoluutio 
on kohtuullinen ja temporaalinen resoluutio erinomainen, mikä mah- 
dollistaa ajallisesti nopeasti tapahtuvan kognitiivisen ja kielellisen pro- 
sessoinnin mittaamisen. (Ahlsén 2006, 161-165.) Neurolingvistisessä 
tutkimuksessa käytetäänkin usein herätevasteita, joita mitataan EEG:114. 
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Kuvio 2. Herätevaste (Commons Wikimedia). 
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Kielellinen syöte näkyy aaltomaisena kuviona, kun samaa kielellistä ärsy- 
kettä koskevista EEG-aalloista lasketaan keskiarvo (ks. kuvio 2). ERP-kom- 
ponentti on yksi tämän monimutkaisemman, keskiarvoista lasketun 
ERP-aallon aalloista. Useimmiten ERP-komponenteista tarkastellaan nii- 
den amplitudia eli vahvuutta, latenssia eli viivettä sekä topografiaa eli si- 
joittumista aivoalueille. ERP-efekti on puolestaan amplitudien erotus kah- 
den eri ERP-komponentin välillä, esimerkiksi kahden eri lauseen välillä. 

Seuraavaksi esitellään kielentutkimuksen yleisimpiä ERP-kompo- 
nentteja ja niiden tutkimuksessa käytettyjä paradigmoja (ks. tarkemmin 
Swaab, Ledoux, Camblin & Boudewyn 2011). Semanttiseen prosessoin- 
tiin on kirjallisuudessa liitetty käsitteellistä poikkeamaa heijastava N400 
ja syntaktiseen prosessointiin varhaista syntaktista prosessointia heijas- 
tava ELAN sekä myöhäistä syntaktista prosessointia heijastava P600 (ks. 
tarkemmin Swaab, Ledoux, Cambln & Boudewyn 2011). 

N400 on varhaisin löydetty kielen prosessoinnin ERP-komponentti 
(Kutas & Hillyard 1980). Kyseessä on ERP-komponentti, jota tarkas- 
tellaan pääasiallisesti reaktiona semanttiseen tai konseptuaaliseen eli 
käsitteelliseen poikkeamaan. N400 ilmenee negatiivisena huippuna 
noin 400 ms kriittisen sanan esittämisen jälkeen. Topografialtaan tämä 
komponentti on sentroparietaalinen, eli elektrodien amplitudi on vahvin 
keskisellä päälaella. N400-komponentti heijastaa vaikeutta integroida 
semanttista informaatiota. Esimerkiksi seuraavanlaisilla lauseilla voi- 
daan tarkastella N400-efektiä: 


(1) Hän levitti leivälle *sukat. 
Hän levitti leivälle voita. 


Kaikille sisältösanoille syntyy N400, mutta komponentin amplitudi on 
sitä voimakkaampi, mitä vaikeampi sanaa on integroida edeltävään kon- 
tekstiin. Myös epäsanojen N400 on suurempi kuin tavallisten sanojen. 
N 400-komponentissa näkyy myös semanttinen heräte-efekti (ks. heräte- 
asetelma yllä): jos herätesana liittyy kriittiseen eli kohdesanaan (esim. 
mehiläinen ja hunaja), jos herätesana toistetaan (hunaja ja hunaja) tai 
jos sanat liittyvät toisiinsa semanttisesti (sokeri ja hunaja), sanan N400 
on pienempi. 
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Syntaktisen prosessoinnin ensimmäisen osan (engl. first pass) ajatel- 
laan olevan automaattista. Tätä automaattista, varhaista prosessointia 
heijastaa ELAN-komponentti eli aikainen vasemman etulohkon nega- 
tiivisuushuippu (engl. early left-anterior negativity) noin 100-200 ms 
kriittisen sanan esittämisen jälkeen. Varhaisen prosessoinnin ajatel- 
laan perustuvan sanaluokkien erotteluun, taivutuksen tunnistamiseen 
ja lauserakenteen alustavaan hahmottamiseen. ELAN-efektiä voidaan 
tarkastella esimerkiksi seuraavanlaisten lauseiden avulla: 


(2) The goose was in the "fed. 
The goose was in the barn fed. 


P600-komponentti liitetään myös syntaktiseen prosessointiin. Se on 
positiivinen aalto noin 600 ms kriittisen sanan esittämisen jälkeen. 
P600-komponentti heijastaa siis reaktiota syntaktiseen poikkeamaan. 
Useimmat tutkijat esittävät, että P600-efekti liittyy lauseen uudelleen- 
analysointiin. Esimerkiksi seuraavanlaisten lauseiden avulla voidaan 
tarkastella P600-efektiä: 


(3) Pikku poika *pelata pallolla. 
Pikku poika pelaa pallolla. 


Kokoavasti voidaan todeta, että offline-menetelmià, kuten nimeäminen 
ja heräteasetelma, käytetään kielenprosessoinnin ei-ajalliseen tarkas- 
teluun. Usein näitä menetelmiä käytetään, kun pilotoidaan online- 
kokeissa käytettävää materiaalia. Online-menetelmillä saadaan puoles- 
taan ajallista tietoa kielenprosessoinnista. Reaktioaikaan perustuvilla 
menetelmillä saadaan tietoa yhdestä mittauspisteestä, esimerkiksi yh- 
den tehtävän suorittamiseen mennyt aika. Jatkuvaan mittaukseen perus- 
tuvilla menetelmillä voidaan tarkastella KH:n kielenprosessointia ajassa 
etenevänä prosessina. 
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Kokeellisen kielentutkimuksen vahvuuksia ja haasteita 


Selkeä tutkimuskysymys. Kun tutkimuskysymys on hyvin muodostettu, 
tutkimus etenee loogisesti tutkimusraporttiin asti. 


Yleistettävyys. Hyvin tehdyn kokeellisen tutkimuksen tulokset ovat yleis- 
tettävissä, riippumatta taustateoriasta. 


Kiinnostavia tutkimuskohteita ja ryhmässä työskentelyä. Kokeellinen 
kielentutkimus on jännittävää, kiinnostavaa ja mukaansatempaavaa. 
Aiemmat tutkimukset nostavat esiin entistäkin kiinnostavampia teemo- 
ja tutkittavaksi. Kokeellista tutkimusta tehdään useimmiten ryhmässä, ja 
tutkimusta tehdessä oppii muilta. 


Datan määrä. Aineiston suuri määrä mahdollistaa tutkimuskysymyksen 
monitasoisen tarkastelun. Erityisesti jatkuvan mittauksen menetelmistä 
saadaan erittäin paljon dataa, mikä toisaalta edellyttää tutkijalta valinto- 
ja tarkastelutavan suhteen. Tarkasti määritelty tutkimuskysymys auttaa 
näiden valintojen tekemisessä. 


Fysiologiset tekijät. Arsykkeet tulee valita ja asemoida koeasetelmiin 
niin, että ne eivät vaikuta tuloksiin. Esimerkiksi silmänliikemittauksis- 
sa tulee varmistaa, että tarkasteltavat sanat eivät ole rivin alussa tai 
lopussa, koska näiden alueiden lukeminen on erilaista kuin rivin kes- 
kiosan. EEG-mittauksessa puolestaan tarkastellaan kohdesanaa usein 
yksittäisenä tai lauseen viimeisenä tai toiseksi viimeisenä sanana, jotta 


EEG-rekisteröinti voidaan lukita näihin sanoihin. 


Psykologis-semanttiset tekijät. Kielellisten ärsykkeiden valinnassa tu- 
lee ottaa huomioon esimerkiksi kohdesanan elollisuus, koska tällaiset 
psykologis-semanttiset tekijät voivat vaikuttaa KH:iden kielenprosessoin- 
tiin ja sitä kautta tuloksiin. Psykologis-semanttiset tekijät voivat joskus 
olla myös tutkimuksen tarkastelun kohteena. 


Määrälliset tekijät. Kun valitaan kielellisiä ärsykkeitä koeasetelmaan, on 
tärkeää ottaa huomioon myös kohdesanojen määrälliset tekijät, esimer- 
kiksi sanan pituus ja yleisyys. Usein lyhyet sanat ovat myös yleisiä, minkä 
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vuoksi voi olla vaikeaa erottaa, kumpi muuttuja koeasetelmassa vaikut- 
taa tarkasteltavaan ilmiöön. 


Laadulliset tekijät. Koeasetelmassa tulee pyrkiä kontrolloimaan tarkasti 
kohdesanojen sanaluokat, vaikka näiden rajat ovat joskus liukuvia (esim. lu- 
kea [verbi] vs. lukeminen [verbaalisubstantiivi]). On myös tärkeää kontrolloi- 
da KH:iden sukupuoli, ikä, koulutus ja mahdolliset muut taustamuuttujat. 


Tutkimuksen työläys ja kalleus. Koeasetelmat ovat usein vaativia ja data 
on sotkuista, joten tutkimustulosten saaminen vaatii runsaasti suunnit- 
telua, työtä ja aikaa. Lisäksi MRI- ja MEG-laitteiden käyttö saattaa olla 
maksullista. 


3.4. Psykolingvistinen esimerkkitutkimus 


Tässä luvussa esitellään psykolingvistinen esimerkkitutkimus visuaa- 
lisesta sanantunnistuksesta ("Lr and L2 word recognition in Finnish”, 
Vainio, Pajunen & Hyónà 2014). Tutkimuksessa tarkasteltiin, poik- 
keaako venäjänkielisten ja kiinankielisten aikuisten suomenoppijoiden 
suomen kielen sanantunnistus äidinkielisten suomenkielisten sanan- 
tunnistuksesta ja toisistaan. Tutkimuksen tarkoituksena oli selvittää, 
missä määrin äidinkielen ja kohdekielen erilaisuus vaikuttaa sanan- 
tunnistukseen kohdekielellä. Riippumattomina muuttujina olivat suo- 
men kielen morfologinen rakenne ja sanan kannan läpinäkyvyys. Nämä 
valittiin tarkastelun kohteeksi, sillä suomen kielessä sanan kantaan li- 
sättävät johtimet ja taivutusmuodot aiheuttavat usein morfofonologisia 
muutoksia sanavartaloon, esim. onki -> onge-ssa. Tutkittavat substantiivit 
olivat yleisiä ja lyhyitä, ja ne esitettiin yksikön nominatiivissa, partitiivis- 
sa tai genetiivissä. Kontrollitilanteena oli nominatiivi (koulu), puhtaasti 
agelutinatiivista sijataivutusta edusti partitiivi (tuolia), ja sanoja, joissa 
oli taivutuksen lisäksi sanavartalon vaihtelua, edusti genetiivi (kengän). 
Kiinalaiset ja venäläiset olivat suomen kielen taidoltaan B2-tasolla eli 
itsenäisiä kielenkäyttäjiä. Taulukossa 2 havainnollistetaan tämän tutki- 
muksen kannalta keskeisiä kielten eroja. 
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suure suomi venäjä kiina 


maksimi kategoriamäärä 1+4 1+4 1+0 
per sana 


keskimääräinen kategoria- | 1+1 1+1 1+0 
määrä per sana 


alisteisia morfeemeja kyllä kyllä ei 

semanttiset roolit kyllä kyllä ei 

sijamerkitty 

kannan transparenssin kyllä kyllä ei 

vaihtelua 

kirjoitustapa segmentaalinen segmentaalinen logografinen 
(latinalainen) (kyrillinen) (kiinalainen) 


kategoriamäärä per sana = yhteenlaskettu morfologisten luokkien määrä sanassa (esim. 
talo-i-ssa-mme-kin = 1 + 4) 


Taulukko 2. Suomen, venäjän ja kiinan typologisia piirteitä. 


Taulukosta 2 selviää, että kiinankielisillä ei ole äidinkielessään koke- 
musta sijataivutuksesta mutta venäjänkielisillä on. Lisäksi venäjässä on 
genetiivin taivutuksen yhteydessä kannan vaihtelua, kun taas kiinan kie- 
lessä ei tällaista ilmiötä ole. Mainittakoon, että kohdesanat vertaistettiin 
lemmafrekvenssin (sanan kaikkien sijamuotojen yhteenlasketun sum- 
man), pintafrekvenssin (sanan tietyn sijamuodon frekvenssin), sana- 
pituuden (kirjainmäärän), konkreettisuusarvioinnin ja omaksumisiän 
arvioinnin mukaan. Sanat olivat yleisiä, koska tarkoitus oli, että keski- 
tasoiset suomenoppijat tietäisivät sanat; tyypillisesti vieraan kielen 
prosessointia tutkitaan melko sujuvasti kieltä osaavilla KH:illä. 
Kokonaisuutena tutkimuksessa käytettiin kahta menetelmää: visuaa- 
lista sanantunnistusta ja silmänliikkeiden rekisteröintiä KH:iden 
lukiessa lauseita. Menetelmillä tarkasteltiin, vaikuttaako äidinkieli 
suomen kielen prosessointiin sanatasolla ja lausetasolla. Mikäli näin 
olisi, morfologinen monimutkaisuus vaikuttaisi eri tavalla kiinalaisiin 
ja venäläisiin sanantunnistuksessa, mutta sitä vastoin määrite-pääsana- 
kongruenssia prosessoitaessa kiinalaisten ja venäläisten tulosten pitäisi 
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olla samankaltaisia. Aiempiin tutkimuksiin perustuvat mallit edustavat 
vastakkaisia näkemyksiä siitä, vaikuttaako äidinkielen ja kohdekielen eri- 
laisuus oppimiseen. Lisäksi on esitetty, että morfofonologinen vaihtelu 
ylipäätään vaikeuttaa vieraan kielen rakenteiden oppimista (DeKeyser 
2.005). 

Kilpailumalli (engl. Unified Competion Model, MacWhinney 2005) 
ennustaa, että kielenoppijat todennäköisesti käyttävät äidinkielensä 
rakenteita uuden kielen oppimisessa: oppiminen on helpompaa, jos 
kielenoppijan äidinkielessä on samankaltaisia rakenteita kuin opitta- 
vassa kielessä. Tämän tutkimuksen osalta kilpailumalli olettaa, että ve- 
näläisille sijataivutus ei ole merkittävä ongelma, joten he prosessoivat 
sanoja samankaltaisesti kuin suomalaiset. 

Pienemann (1998) on puolestaan esittänyt prosessoitavuusteorian 
(engl. Processability Theory), jossa on kaksi keskeistä periaatetta. Ensim- 
mäisen periaatteen mukaan äidinkielen omaksuminen perustuu tiettyyn 
poikkeuksettomaan kehitykselliseen järjestykseen. Toinen keskeinen 
periaate on, että tämä oppimishierarkia pätee myös vieraan kielen oppi- 
miseen, eli äidinkielen ja kohdekielen erolla ei ole merkitystä. Näin ol- 
len prosessoitavuusteoria olettaa venäläisten ja kiinalaisten suoriutuvan 
suomen sanantunnistuksesta samalla tavalla. 

Kolmas näkökulma teemaan on morfologisen jäsennyskyvyn puut- 
teellisuuden hypoteesi (engl. Morphological Decomposition Deficiency 
Hypothesis), joka perustuu ajatukseen siitä, että vieraan kielen (L2) oppi- 
jat eivät pysty prosessoimaan vieraan kielen taivutusmorfologiaa. Taus- 
talla on kaksi näkemystä, joista ensimmäinen perustuu aivokuvantami- 
sessa havaittuihin tuloksiin (Ullman 2001). Niiden mukaan L2-oppijat 
prosessoivat leksikkoa ja semantiikkaa samalla muistialueella kuin 
äidinkieliset. VanPatten (2004) puolestaan esittää mallin, jossa kes- 
keisenä ajatuksena on merkityksen ensisijaisuus, mikä tarkoittaa, että 
kielenoppijat oppivat ensin prosessoimaan sanojen merkityksen ennen 
kuin he oppivat prosessoimaan sanojen muodon. Siten oppijat käyttävät 
mieluummin leksikaalista kuin morfologista tietoa päättäessään lause- 
rakenteen ajallisesta viittauksesta (VanPatten & Jegerski 2010). 

Kaikille yllämainituille malleille on yhteistä, että niiden mu- 
kaan morfologisesti mutkikkaat taivutetut sanat ovat jäsennettyinä 
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mentaalileksikossa. Vaihtoehtoinen tulkinta, esim. yhteneväisyysteoria 
(engl. Convergent Theory, Gonnerman, Seidenberg & Andersen 2007), 
olettaa, että taivutusmorfologia ei ole mentaalileksikossa erillisinä kan- 
toina ja affikseina. Jos näin on, morfologisen monimutkaisuuden ei pi- 
täisi vaikuttaa reaktioaikoihin. 

Esiteltävän tutkimuksen tulokset ovat alla olevassa taulukossa 3. Ti- 
lastoanalyysit osoittivat, että reaktioaikoja tarkasteltaessa saatiin tilastol- 
lisesti merkitsevät sijamuodon ja äidinkielen (Lt) päävaikutukset sekä 
näiden yhdysvaikutus. Avattuna yhdysvaikutus paljasti, että äidinkieli- 
set suomenkieliset prosessoivat nominatiivit merkitsevästi nopeammin 
kuin taivutetut sijat (partitiivi ja genetiivi), joiden välillä ei ollut merkit- 
sevää eroa. Tämän tutkimuksen reaktioaikatulos suomalaisten osalta 
voidaan siis esittää lyhyesti seuraavasti: nominatiivi < partitiivi = gene- 
tiivi. Tulokset toistivat aiempien suomen kielen tutkimusten tulokset. 


nominatiivi partitiivi genetiivi 

li tarkasteltava | KA KH KA KH KA KH 

tekija 
suomen- | reaktioaika 665 130 702 121 719 130 
kieliset 

virhemäärä | 1,3 2,4 3,8 47 5,3 5,8 
kiinan- reaktioaika 927 192 961 215 1078 267 
kieliset 

virhemäärä 10,5 5,1 11,4 10,1 29,7 17,9 
venäjän- | reaktioaika 880 175 1035 222 1134 255 
kieliset 

virhemäärä 8,8 15,6 8,8 8,1 18,3 87 


KA = keskiarvo; KH = keskihajonta. 


Taulukko 3. Keskimääräiset reaktioajat (millisekunteina) ja virhemäärät (prosent- 
teina) sekä niiden keskihajonnat suomalaisilla, kiinalaisilla ja venäläisillä. 


Kiinankielisten reaktioaikojen tilastotulokset osoittivat, että kiinan- 
kielisillä genetiivin prosessointi poikkesi merkitsevästi sekä nomina- 
tiivin että partitiivin prosessoinnista mutta nominatiivin ja partitiivin 
prosessointi oli samankaltaista. Tulos viittaa siihen, että kiinalaiset eivät 
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prosessoineet morfologista rakennetta, sillä partitiivin ja nominatiivin 
välillä ei ollut eroa. Sen sijaan sanavartalon läpinäkyvyys vaikutti proses- 
sointiin siten, että kun sanavartalossa oli vaihteluita, niin tunnistusaika 
oli merkitsevästi pidempi. Tulokset voidaan esittää lyhyesti seuraavasti: 
nominatiivi = partitiivi < genetiivi. 

Venäjänkielisillä nominatiivien prosessointi oli merkitsevästi no- 
peampaa kuin partitiivien ja genetiivien. Myös partitiivit prosessoitiin 
nopeammin kuin genetiivit, vaikkei tämä tulos ollut kokonaisuudessaan 
merkitsevä. Tulos viittasi siihen, että venäjänkielisten prosessointi oli 
melko samanlaista kuin suomenkielisten eli lyhyesti: nominatiivi < par- 
titiivi < genetiivi. 

Kun tarkasteltiin virheitä eli tilanteita, joissa KH:t olivat vastanneet 
väärin, tilastotulokset osoittivat, että erikieliset puhujaryhmät erosivat 
toisistaan merkitsevästi ja myös eri sijoissa tehtiin tilastollisesti merkit- 
sevästi eri määriä virheitä. Äidinkielen ja sijan yhdysvaikutus oli myös 
tilastollisesti merkitsevä, eli suomenkieliset tuottivat kaikki sijat samalla 
tavalla oikein. Sekä kiinankielisillä että venäjänkielisillä virhemäärät oli- 
vat samankaltaiset, eli genetiivissä tehtiin enemmän virheitä kuin nomi- 
natiivissa ja partitiivissa. 

Tulokset tukevat kilpailumallin ennustetta, sillä venäjänkieliset pro- 
sessoivat suomen sanoja samankaltaisesti kuin suomenkieliset mutta 
kiinankielisillä vain sanavartalon läpinäkyvyys vaikutti prosessointiin. 
Sen sijaan prosessoitavuusteoria ja morfologisen jäsennyksen puutteel- 
lisuusteoria eivät saa vahvistusta. Virheiden tarkastelu osoitti selvästi, 
että sanavartalon läpinäkyvyys on merkittävä tekijä L2-oppijoiden pro- 
sessoinnissa, kuten DeKeyser (2005) ennustaa. 

Yllä esitettyjen tulosten perusteella voisi olettaa, että koska kiinan- 
kieliset suomen oppijat eivät kiinnitä taivutusmorfologiaan huomiota sa- 
nantunnistuksessa, he eivät myöskään hyödynnä taivutusmorfologiaan 
perustuvaa määritteen ja pääsanan kongruenssia lauseen lukemisessa. 
Samat kiinankieliset KH:t osallistuivat myös lukemiskokeeseen (Vainio, 
Pajunen & Hyönä 2016), jossa sekä kiinankieliset että venäjänkieliset 
hyödynsivät suomen määritteen ja pääsanan kongruenssia samanlai- 
sesti. Tulos on selitettävissä sillä, että kiinankielisillä on äidinkielensä 
perusteella kokemusta siitä, että lausekkeen osia liitetään yhteen eri 
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keinoin, vaikkei heillä ole kokemusta sanan sijataivutuksesta sinänsä. 
Tällainen ajatus sopii hyvin esim. Sabourinin ja Stowen (2008) mal- 
liin, jossa korostetaan prosessointirutiinien siirtoa (engl. Transfer of 
Processing Routines) representaatioiden siirron sijaan, eli omassa kie- 
lessä oleva sanojen yhdistämisen periaate voidaan yleistää toisen kielen 
oppimiseen. 


3.5. Neurolingvistinen esimerkkitutkimus 


Tässä luvussa esitellään yksi suomalainen neurolingvistinen väitöskirja- 
tutkimus kielitieteen alalta. Tutkimus käsittelee MS-tautia sairastavien 
kieltä ja sen suhdetta taudin yhteen oireeseen, kognitiiviseen uupu- 
mukseen (Heikkola 2017). Tutkimuksessa tarkasteltiin, eroavatko MS- 
tautia sairastavien kielelliset kyvyt ja puheentuotto terveistä verrokeista 
ja korreloiko MS-taudin yksi oire, kognitiivinen uupumus, puheen- 
tuoton kanssa. Kognitiivisella uupumuksella tarkoitetaan subjektiivista 
energian puutetta, jonka yksilö tai hänen hoitajansa kokee häiritsevän 
tavanomaisia tai toivottuja toimintoja. Koska kielellinen toiminta on kes- 
keinen MS-tautia sairastavien arkielämässä selviytymisessä (Murdoch 
& Theodoros 2000), oli tärkeää selvittää, millainen vaikutus kognitii- 
visella uupumuksella on kieleen. MS-tautia sairastavien kielihäiriöitä 
ei ole aiemmin juurikaan tutkittu kielitieteellisestä näkökulmasta, eikä 
kognitiivisen uupumuksen vaikutusta MS-tautia sairastavien kieleen ole 
aiemmin tutkittu lainkaan. 

Koska MS-taudin oireet vaihtelevat suuresti yksilöiden välillä, myös 
siihen liittyvien kielihäiriöiden kirjo on suuri. Tapaustutkimuksissa on 
todettu, että MS-tautiin liittyy ongelmia nimeämisessä ja toistamisessa 
(Olmos-Lau, Ginsberg & Geller 1977). Ryhmätutkimuksissa on lisäksi 
esitetty, että myös puheen sujuvuudessa ja lukemisessa sekä kirjoitta- 
misessa voi olla ongelmia (Murdoch & Lethlean 2000). 35 tutkimusta 
kattavassa metatutkimuksessa on todettu, että MS-tautia sairastavilla 
muutokset sanasujuvuudessa ovat yleisimpiä kielen häiriöistä (Henry & 
Beatty 2006). MS-tautia sairastavien kieltä ei kuitenkaan olla juurikaan 
tarkasteltu teksti- tai diskurssitasolla (Arrondo, Sepulcre, Dugue, Toledo 
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& Villoslada 2010). Nykyään erilaisia neurologisperäisiin sairauksiin 
liittyviä kielihäiriöitä on alettu tarkastella semispontaanien narratiivien 
eli vapaasti kuvamateriaalin perusteella kerrottujen tarinoiden kieltä 
analysoimalla (ks. Lind, Kristoffersen, Moen & Simonsen 2009). 

Tutkimuksessa riippumattomina muuttujina olivat MS-tautidiagnoosi 
sekä MS-taudin tyyppi ja vakavuusaste. MS-tutkimuksen aineisto oli 
kolmitahoinen. MS-tautidiagnoosin sekä taudin tyypin ja vakavuus- 
asteen määritteli neurologi. Toiseksi KH:t testattiin laajalla neuropsyko- 
logisella testipatteristolla yhteistyössä neuropsykologin kanssa, jotta saa- 
tiin selville KH:iden kognitiivinen perustaso sekä kielellisen kognition 
taso. Lisäksi arvioitiin sekä koetun että mitattavissa olevan kognitiivi- 
sen uupumuksen määrää. Kolmanneksi KH:t osallistuivat kielelliseen 
testaukseen, jossa he kertoivat semispontaaneja tarinoita kuvakirjojen 
pohjalta. Kuvakirjojen välissä oli tehtävän vaikeuttamiseksi kaksi täyte- 
tehtävää, joissa KH:t puhuivat myös kuvamateriaalin pohjalta. Kielelli- 
nen testaus oli pitkäkestoinen, koska tutkimuksessa haluttiin tarkastella 
kognitiivisen uupumuksen vaikutusta kieleen. Aineistoa tarkasteltiin 
tilastollisesti ANOVA-testien ja korrelaatiokerrointen avulla. 

Aiemman tutkimuksen perusteella oletettiin, että MS-tautia sairas- 
tavat suoriutuvat heikommin kognitiota arvioivista tehtävistä ja että 
he kokevat enemmän kognitiivista uupumusta. Lisäksi oletettiin, että 
MS-tautia sairastavien sujuvuus tarinoiden kertomisessa on heikompi 
kuin verrokeilla. Oletettiin myös, että MS-tautia sairastavilla suurempi 
kognitiivinen uupumus korreloi tarinoiden sujuvuuden heikkenemi- 
sen kanssa, toisin kuin verrokeilla. Lisäksi oletettiin, että vakavampaa 
MS-taudin muotoa sairastavilla kognition ja kielen häiriöt olisivat vaka- 
vampia kuin lievempää taudin muotoa sairastavilla. 

Tutkimuksen tulosten mukaan MS-tautia sairastavien kognitiivinen 
perustaso oli heikentynyt verrokkeihin verrattuna. Tämä on linjassa 
aiemman tutkimuksen kanssa (Kujala, Portin, Revonsuo & Ruutiainen 
1994). Yllättävästi MS-ryhmän kielellinen kognitio oli osittain säilynyt, 
esimerkiksi nimeämisen osalta, vaikka juuri nimeämisen on aiem- 
missa tutkimuksessa osoitettu heikentyneen MS-taudissa (Murdoch 
& Lethlean 2000; Kujala, Portin & Ruutiainen 1996). Sekä subjek- 
tiivista että objektiivista kognitiivista uupumusta esiintyi enemmän 


1016 LEENA MARIA HEIKKOLA JA SEPPO VAINIO 


MS-ryhmässä. Oletuksen vastaisesti lievempää MS-taudin muotoa sai- 
rastavilla oli enemmän puutteita kognitiivisissa kyvyissä. 

Myös kielen suhteen MS-ryhmä suoriutui heikommin kuin verrokki- 
ryhmä. MS-tautia sairastavien tarinat eivät olleet yhtä sujuvia kuin 
verrokeilla. Kognitiivisen uupumuksen vaikutus näkyi MS-ryhmällä 
siten, että tarinoiden alut olivat sujuvampia kuin niiden loput. Lisäk- 
si MS-tautia sairastavien ensimmäiset tarinat olivat sujuvampia kuin 
heidän kertomansa kolmannet, kielitestauksen viimeiset tarinat. Yhden 
tarinan sisällön tarkastelussa MS-tautia sairastavilla ilmeni enemmän 
täysin virheellisiä sisältöyksikköjä, mutta muuten tarinoiden sisällöissä 
ei ollut laadullisia eroja ryhmien välillä. Oletuksen mukaisesti lievem- 
pää MS-taudin muotoa sairastavilla tarinoiden sujuvuus ja sisältöjen 
koherenssi olivat säilyneet paremmin kuin taudin vakavampaa muotoa 
sairastavilla. 

MS-tautia sairastavilla oli myös yhteys objektiivisesti mitatun kogni- 
tiivisen uupumuksen sekä kolmen suullisesti kerrotun tarinan keston 
välillä, mikä oli hypoteesin mukaista. Lisäksi kielellisen testauksen ai- 
kana arvioidun puheentuoton aiheuttaman koetun väsymyksen ja tari- 
noiden sisällön koherenssin välillä oli yhteys. Oletetusti myös tarinoiden 
sujuvuuden ja neuropsykologisella testillä arvioidun semanttisen sana- 
sujuvuuden (eli esimerkiksi kuinka monta eläintä KH ehtii nimetä mi- 
nuutissa) välillä oli yhteys. Niin ikään oletetusti vakavampaa MS-taudin 
muotoa sairastavilla tämä yhteys oli selvempi kuin taudin lievempää 
muotoa sairastavilla. 

Tutkimuksen tulosten perusteella MS-tautia sairastavien kognitiivi- 
nen perustaso ja kielelliset kyvyt ovat selvästi heikentyneet terveisiin 
verrokkeihin verrattuna. Sekä koetun että objektiivisesti mitatun kogni- 
tiivisen uupumuksen ja kielentuottamisen välillä oli yhteyksiä: korkeam- 
pi kognitiivinen uupumus näkyi usein kielentuotossa vähentyneenä su- 
juvuutena tai tarinan sisällön koherenssin puutteina. 
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3.6. Kokeellisen kielentutkimuksen lähialat 


Kuten edellä on esitetty, psyko- ja neurolingvistiikka ovat hyvin poikki- 
tieteellisiä aloja. Psyko- ja neurolingvistiikka ovat ottaneet vaikutteita 
monilta eri aloilta, joista seuraavaksi esitellään tärkeimpiä. 

Yleinen kielitiede. Yksi suurimmista kielitieteellisistä vaikutteista 
kokeelliseen kielentutkimukseen on strukturalismi (de Saussure 1916), 
jonka mukaan kieli koostuu sen eri aspekteja esittävistä järjestelmistä 
(fonologia, morfologia, semantiikka, syntaksi ja leksikko). Myös Noam 
Chomskyn kehittämä generatiivinen kielioppi on vaikuttanut erityisesti 
syntaksin prosessointiin liittyvään kokeelliseen kielentutkimukseen. Li- 
säksi kognitiivinen semantiikka eli yritys tehdä mentaalimalleja semant- 
tisista prosesseista on vaikuttanut jonkin verran esimerkiksi afasiassa 
esiintyvien semanttisten ongelmien tarkasteluun. Nykyään myös funk- 
tionalismi eli kielen funktioihin perustuva näkemys kielestä vaikuttaa 
kokeelliseen kielentutkimukseen. Kokeellisen kielentutkimuksen taus- 
talla vaikuttavat usein myös kognitiivisen kielitieteen näkemykset (ks. 
Kieliopin tutkimus ja kielioppiteoriat tk.). 

Kliininen kielitiede, aivoperäisten kielihäiriöiden puhe- ja kielitera- 


pia. Monet afasiaterapian arviointi- ja kuntoutusmenetelmät perustuvat 
klassisiin viitekehyksiin, kuten Lurian teoriaan, joiden mukaan toimin- 
nallisia järjestelmiä kuntoutetaan askeleittain. Muut terapiat liittyvät 
Wernicke-Lichtheim-Geschwind-viitekehyksen teoreettisiin oletuksiin. 
Näissä terapioissa keskitytään aktivoimaan säilyneitä aivojen keskuksia, 
joita ei primaaristi käytetä kielen toimintoihin, jotta nämä keskukset voi- 
sivat välittää kielitoimintoja. Näitä terapiamuotoja ovat mm. VIC (engl. 
visual communication therapy, Gardner, Zurif, Berry & Baker 1976), VAT 
(engl. visual activation therapy, Helm-Estabrooks, Fitzpatrick & Barresi 
1982) ja MIT (engl. melodic intonation therapy, Albert, Goodglass & 
Helm 1973). Jotkin uudemmat terapiamuodot ovat kommunikaatio- 
pohjaisia, kuten PACE (engl. Promoting Aphasics’ Communicative 
Efficiency, Carlomagno 1994). Nykyään käytettäviin terapiamuotoihin 
vaikuttavat myös pragmaattinen koulukunta, neurolingvistinen koulu- 
kunta ja kognitiivisen neuropsykologian koulukunta. 
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Aivokuvantaminen ja aivojen dynaamisten prosessien tutkimus. 
Aivokuvantamisen kehitys on ollut suuri lapimurto kokeellisessa kielen- 
tutkimuksessa. Aivorakenteen kuvantaminen tietokonetomografialla ja 
MR-kuvantaminen sekä aivotoiminnan kuvantaminen PET:llä, fMRI:llä, 
MEG:llà, EEG:llä ja herätevasteilla mahdollistavat kielellisen ja kognitii- 
visen prosessoinnin tarkastelun reaaliajassa sekä terveissä että vaurioi- 
tuneissa aivoissa. Aivokuvantamisen ja psykolingvististen kokeellisten 
tekniikoiden yhdistäminen ei välttämättä ole suoraviivaista eikä tulosten 
tulkinta yksinkertaista, mutta nämä yhdistämällä saadaan uutta ja tär- 
keää tietoa kielen prosessoinnista. 

Psykologia ja kognitiotiede. Muun muassa Weisenburgin ja McBriden 
(1935) käyttämillä psykologian arviointimenetelmillä, joilla on tarkastel- 
tu kielellistä ja ei-kielellistä kognitiota afasiaa sairastavilla ja kontrolli- 
ryhmillä, on ollut laaja vaikutus erityisesti neurolingvistiikan menetel- 
miin. Kokeellisessa kielentutkimuksessa käytetään edelleen kokeellisia 
asetelmia ja tilastoanalyyseja, joita käytettiin 1960- ja 1970-luvuilla 
afasian ryhmätutkimuksissa. 1980-luvulta lähtien afasiaa on tarkasteltu 
yhä enemmän myös kokeellisten yksittäistapausten kautta (näiden tut- 
kimustapojen käytöstä kokeellisessa kielentutkimuksessa ks. Caramazza 
1984). 

Tietokonesimulaatiot ja mallintaminen. Tietokonesimulaatioilla voi- 
daan testata ja hienosäätää kielen prosessointimalleja. Simulaatioilla voi- 
daan esimerkiksi tutkia, miten hypoteettiset leesiot eli tietyn aivoalueen 
vammat vaikuttavat kognitiiviseen prosessointiin hypoteettisten mal- 
lien mukaan. Kielen tuottamisen ja ymmärtämisen seriaaliprosessoin- 
timalleja on käytetty kokeellisessa kielentutkimuksessa jo 1980-luvulta. 
Viime vuosikymmeninä niitä on käytetty viitekehyksinä useimmissa 
psyko- ja neurolingvistiikan kokeellisissa tutkimuksissa sekä terveillä 
että aivovaurion saaneilla KH:illa. Viime vuosina erityisesti paralleeli- 
prosessointimallien ja konnektionististen eli keinoneuraaliverkostojen 
simulaatioiden käyttö on lisääntynyt kokeellisessa kielentutkimuksessa. 
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4. Yhteenveto 


Tässä luvussa on esitelty lyhyesti psyko- ja neurolingvistiikan tutkimus- 
ta. Ala on ollut olemassa nykyisessä muodossaan 1900-luvun lopulta, ja 
erityisesti tietokoneiden ja aivokuvantamisen valtava kehitys on avannut 
uusia mahdollisuuksia tarkastella mielen, aivojen ja kielen yhteyksiä. 

Kokeellinen tutkimus on useimmiten ryhmätyötä, johon osallistuvat 
eri alojen ammattilaiset. Koeasetelmien suunnittelu ja kokeiden valmis- 
telu on aikaa vievää, ja usein on vaikeaa kontrolloida kaikkea, mikä voi 
vaikuttaa tutkimuksen tuloksiin. Hyvällä koesuunnittelulla ja järjestel- 
mällisellä testaamisella voidaan kuitenkin saavuttaa tuloksia, jotka ker- 
tovat jotain uutta siitä, miten me ihmiset prosessoimme kieltä. 

Psyko- ja neurolingvistiikasta kiinnostuneen on hyvä tutustua oma- 
toimisesti lähitieteisiin, erityisesti yleiseen kielitieteeseen, psykologiaan 
ja kognitiiviseen neurotieteeseen. Myös tutkimustekniikkaan, esimer- 
kiksi silmänliikekameroihin ja EEG-laitteisiin, on hyvä tutustua. Parhaat 
mahdollisuudet psyko- ja neurolingvistisen tutkimuksen tekemiseen 
ovat tutkimusryhmässä, jossa kokeneempien tutkijoiden johdolla pääsee 
tutustumaan mielen, aivojen ja kielen ihmeellisiin yhteyksiin. 
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English abstract 


Methods in Linguistics is a collection of articles presenting a broad variety 
of methods and approaches in the field of linguistics. It offers structure 
to the spectrum of methodological possibilities and helps the reader to 
identify the field of application as well as the strengths and weaknesses 
of different methods. The book consists of an extensive introductory 
part and a variety of articles, each written by experts of the method in 
question. It discusses questions related to different kinds of data and 
data collection, as well as methods used for analysing data. Since the 
methods used in linguistics are often related to a specific linguistic 
current, the book offers examples from a wide range of linguistic 
approaches. 

The book is addressed to students, researchers and other 
readers interested in the methods used in linguistics. The general 
methodological and metatheoretical knowledge offered in the 
introduction guides the reader through the different methodological 
choices presented and helps the reader to select the best method to 
meet her needs. First, the research process is explained step-by-step 
from the selection of topic and data to questions related to research 
design, analysis and the reporting of the results. The second part of the 
introduction focuses on fundamental theoretical and methodological 
questions, such as the criteria for knowledge, the nature of scientific 
knowledge and the scientific method. The third part addresses more 
specifically the methodology of linguistics, discussing the multifaceted 
nature of natural language and linguistics as a discipline. The 
introduction also covers many current topics in science, such as research 
ethics, data protection and open science principles. 

The book can be used as self-study material by students and 
researchers alike, or as course material in higher education. Learning 
is supported by the careful definition of terms, extensive indexes and 
additional readings suggested for each topic. 
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historiallinen sosiolingvistiikka ja pragmatiikka, kielellisen ja yhteiskun- 
nallisen muutoksen suhteet sekä korpustutkimus. 

O https://orcid.org/0000-0001-8428-4423 
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FT GEDA PAULSEN on tutkija ja leksikografi Viron Eesti Keele Instituutis- 
sa. Hänen tutkimusaiheensa koskevat leksikaalista semantiikkaa, suomen 
kielen johto-oppia, suomen ja viron vertailua sekä soveltavaa kielitiedettä. 
O https: //orcid.org/0000-0002-2749-4528 


FT PEKKA PALLI on dosentti ja vanhempi yliopistonlehtori Aalto- 
yliopiston kauppakorkeakoulussa. Hän tutkii tekstejä ja kasvokkaista 
vuorovaikutusta osana organisaatioiden ja johtamisen käytäntöjä. 

O https: //orcid.org/0000-0003-0287-8813 


FT SARI POYHONEN on soveltavan kielentutkimuksen professori Jyväs- 
kylän yliopistossa. Hänen tutkimuksensa keskittyvät kielikoulutus-, 
maahanmuutto- ja kotouttamispolitiikkaan, kuulumisen narratiiveihin 
sekä kielen ja taiteen risteämiin. 

O https://orcid.org/0000-0003-1507-7206 


FT JANNE SAARIKIVI on Helsingin yliopiston suomalais-ugrilaisten kiel- 
ten ma. professori. Hän on tutkinut mm. suomalais-ugrilaista substraat- 
tia Pohjois-Venäjän murteissa, kielialueiden muuttumisen dynamiikkaa, 
vähemmistökielten säilymisen edellytyksiä sekä uralilaisten kielten sa- 
naston historiaa (esim. suomen slaavilaislainoja ja permiläisten kielten 
itämerensuomalaisia lainoja). 


FT ERIKA SANDMAN työskentelee yleisen kielitieteen yliopistonlehtori- 
na Helsingin yliopistossa. Hän on kirjoittanut väitöskirjatyönään Länsi- 
Kiinassa puhutun, sinotiibetiläiseen kielikuntaan kuuluvan wutunin kielen 
referenssikieliopin. Hän on lisäksi tehnyt kenttätyötä Sahalinin saarella 
Venäjän Kaukoidässä uhanalaisen isolaattikieli nivhin puhujien parissa. 
O https: //orcid.org/0000-0002-2341-2927 


FT MINNA SEPPÄNEN on klassillisten kielten yliopistonlehtori Turun 
yliopistossa. Hän on tutkinut erityisesti kielen- ja kirjallisuudentutki- 
muksen kehitystä kreikkalais-roomalaisessa antiikissa sekä klassillisten 
kielten asemaa ja merkitystä autonomian ajan Suomessa. 

O https: //orcid.org/0000-0001-6623-5708 
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FT KAIUS SINNEMAKI on kvantitatiivisen ja vertailevan kielitieteen apu- 
laisprofessori Helsingin yliopistossa. Hänen tutkimusalojaan ovat maail- 
man kielten välinen vertailu eli kielitypologia, sosiolingvistinen typo- 
logia sekä kvantitatiiviset menetelmät kielentutkimuksessa. 

O https: //orcid.org/0000-0002-6972-5216 


FT PAULA SJÖBLOM on suomen kielen yliopistonlehtori ja dosentti Turun 
ylipistossa. Hänen alaansa ovat (kognitiivinen) nimistöntutkimus, 
tekstin- ja diskurssintutkimus sekä mainonnan ja talouselämän kieli. 
O https://orcid.org/0000-0002-7392-2300 


FT JANNE SKAFFARI on englannin kielen yliopistonlehtori Turun yli- 
opistossa. Hän opettaa kielihistoriaa, kielioppeja ja kieliasiantunti- 
juutta sekä tutkii erityisesti koodinvaihtoa ja lainasanoja muinais- ja 
keskienglannissa. 

O https: //orcid.org/0000-0001-7349-9904 


PHD MARJA-LEENA SORJONEN on suomen kielen professori Helsingin 
yliopistossa. Hänen keskeisiä kiinnostuksen kohteitaan ovat keskustelun- 
analyysi, vuorovaikutuslingvistiikka, variaationtutkimus, multimodaali- 
suus ja institutionaalinen vuorovaikutus. 

O https: //orcid.org/0000-0002-8225-6805 


FT TANJA SÄILY toimii englannin kielen apulaisprofessorina Helsingin 
yliopistossa. Hänen tutkimusalueisiinsa lukeutuvat korpuslingvistiikka, 
digitaaliset ihmistieteet, historiallinen sosiolingvistiikka, kielen vaihtelu 
ja muutos sekä englannin sanasto ja muoto-oppi. 

O https: //orcid.org/0000-0003-4407-8929 


FT LIISA TIITTULA on Helsingin yliopiston saksan kielen kääntämisen 
emeritaprofessori. Hänen tutkimusalueitaan ovat kirjallisuuden kääntä- 
minen, kirjoitus- ja kuvailutulkkaus, multimodaalinen vuorovaikutus ja 
saksalais-suomalainen talousviestintä. 

O https: //orcid.org/0000-0002-4688-0854 
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FT SEPPO VAINIO on erikoistutkija Turun yliopistossa. Hanen erityis- 
alansa on psykolingvistiikka. 


FT ULLA VANHATALO on yleisen kielitieteen dosentti Helsingin yliopis- 
tossa. Hänen alaansa ovat sanojen merkityksen tutkimus, yksinkertai- 
nen sanasto, merkityksen tutkimuksen menetelmät, selkokielen tutki- 
mus ja kieliaineiden tutkijakoulutus. 

O https://orcid.org/0000-0002-2939-7836 


FT TURO VARTIAINEN työskentelee tutkijatohtorina Helsingin yliopis- 
tossa. Hänen erikoisalojaan ovat englannin kielen vaihtelu ja muutos, 
historiallinen sosiolingvistiikka sekä konstruktiokielioppi. 

O https: //orcid.org/0000-0002-4760-750X 


VIT KIMMO VEHKALAHTI on soveltavan tilastotieteen dosentti ja Opet- 
tajien akatemian jäsen Helsingin yliopistossa. Hänen tutkimusalojaan 
ovat yhteiskuntadatatieteen soveltava opetus ja tutkimus, tilastolliset 
monimuuttujamenetelmät ja avoimen tieteen ohjelmistot. 

O https: //orcid.org/0000-0001-6540-7328 


FT MIKKO T. VIRTANEN on suomen kielen tutkijatohtori Helsingin 
yliopistossa. Hänen erikoisalanaan on tekstin- ja diskurssintutkimus. 
Hänen tutkimuksensa ovat käsitelleet muun muassa tarinankerrontaa 
tietokirjallisuudessa, mikro- ja makrotason toiminnan suhdetta tieteen 
teksteissä, topiikkien hallintaa monenkeskisessä pikaviestittelyssä sekä 
vanhuuden representaatioita uutismediassa. 

O https://orcid.org/0000-0002-8126-5929 


FT MAX WAHISTRÖM on eteläslaavilaisten kielten yliopistonlehtori 
Helsingin yliopistossa. Hän tutkii muun muassa argumentin merkin- 
tää ja viittaussuhteita kenttätyöaineistojen, historiallisten tekstien sekä 
typologisten piirreaineistojen avulla. 

O https://orcid.org/0000-0002-9585-5217 
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Asiasanahakemisto 


Hakemistossa on listattu kunkin sanan substantiivimuoto (esim. realismi), mutta viittaukset 


voivat sisältää myös hakusanan eri johdannaisia (kuten realisti, realistisuus, realistinen). Va- 


kiintuneet termit, esimerkiksi diskurssintutkimus, ovat pääosin omina hakusanoinaan, mutta 


hakusanoja on voitu koota yläkäsitteiden alle, kuten sanan tutkimus alle. Rinnakkaistermit 


(esim. epistemologia ja tieto-oppi) on yleisesti merkitty omiksi hakusanoikseen kuitenkin ris- 


tiviittein. 


A 

abduktio, ks. päättely 

adstraatti 564, 574 

Afrikka 147, 471, 560, 563, 573, 579, 654, 657, 
664, 686, 726-727 

agglutinaatio 643, 660, 670, 693, 740, 1010 

aikamuoto 546, 567, 608, 713, 753, 762, 898 

aineisto 1, 3-5, 8-10, 13-14, 16, 19-30, 43 
44, 46, 48-51, 54-60, 69, 75-76, 87-88, 
96-97, 110-111, 117-119, 129, 135, 139—141, 
144-145, 148, 171-172, 175, 182-183, 192, 
194, 201—202, 214, 216, 223-228, 230-231, 
233-234, 240—241, 243-247, 250-254, 
258—270, 274—275, 277, 279—281, 283, 
285-286, 291-294, 296, 298, 300, 302— 
304, 306-308, 314-315, 330, 332, 338, 342, 
346, 348, 350, 354, 356-362, 364-366, 
374, 376, 381, 383, 386-390, 399-400, 
405-406, 412-438, 446, 451, 453-455, 
457, 461-473, 476-479, 487-491, 493-517, 
519, 525, 527—535, 539-543, 548-549, 
551-552, 569-570, 577, 587, 589-590, 
596—604, 606-608, 611, 613, 615-622, 
624, 626-633, 639-643, 645, 649-650, 
655, 658, 660—661, 679—680, 687—688, 
690, 693-694, 696-699, 726, 729-737, 
741, 743, 751, 769, 778, 783-785, 788-790, 
792, 794-797, 803-804, 806, 808, 810, 
812, 818-822, 824-825, 833, 835, 837-838, 
840-844, 850, 853, 855, 864-865, 
869-872, 874-877, 880—881, 887, 898, 
904, 908-912, 926, 942, 944-945, 949, 
951, 953, 955-956, 958-959, 966-967, 


969-970, 973, 986, 993, 995-997, 999, 
1009, 1016 
kenttätyöaineisto 599, 619, 627—628, 630 
kieliaineisto 20—21, 96, 138, 142, 241, 267, 
434—435, 464, 467-468, 491, 502, 526, 
529, 534, 552, 598, 601, 619, 628, 630, 
632, 730, 732, 734-735, 769 
korpusaineisto t. korpusmateriaali 14, 24, 
29, 88, 140, 219, 223, 227, 435, 494, 497, 
527-528, 530, 533-535, 551-552 
kyselyaineisto 241, 246, 251, 262, 639, 733 
aineistolähtöisyys 13, 58, 528, 602, 783, 797, 
865, 912 
aineiston koko, ks. myös otos 14, 19, 261, 
420, 470, 504, 842-843 
aineistonhallintasuunnitelma 22 
aineistonkeruu 29, 191—192, 246, 255, 259- 
261, 275, 277, 283, 291—294, 300, 306, 
347-349, 356-359, 367, 388, 599-600, 
608, 620, 626, 633, 844, 874, 876, 910, 
944, 951 
aineistotyyppi 192, 375, 379, 383, 389-390, 
419, 461 
aivokuvantaminen 988, 1002, 1012, 
1019-1020 
aivosähkökäyrä (sis. myös EEG, elektroen- 
kefalografia) 340, 992, 1005-1007, 1009, 
1019-1020 
aivot 24, 64, 118, 131, 148, 195, 217, 319, 985, 
989, 1005-1006, 1018-1020 
akkommodaatio 568-570 
alkuperáiskansa 168, 178, 350, 744, 878 
alkuperäiskieli 561, 598, 624 
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Amazon 611, 661 
analogia 22, 128, 133, 329, 386, 405, 682- 
683, 690—691, 710, 816, 825 
analyysi 1, 3, 6-8, 14, 22-23, 29-30, 48, 
54-55, 57-59, 82, 87-88, 118, 121, 140-142, 
177, 191, 193-195, 209, 215, 217-219, 223, 
228, 247, 252, 255-259, 262-266, 268, 
270, 278, 283, 305, 325, 335-336, 347-350, 
352, 356, 358-361, 364-367, 374-376, 378, 
380—382, 384-396, 398, 400-401, 404- 
406, 412, 415, 417, 420-422, 426-427, 
430-431, 434-438, 442-446, 450—457, 
464, 468, 472, 478-479, 487-491, 493- 
498, 501-502, 505, 507-508, 512, 514, 516, 
519, 549, 551, 568, 598, 601, 627—628, 630, 
641—643, 646, 648, 650, 658, 660—662, 
672, 711-712, 731, 733, 734-736, 744, 
753-754, 759, 761, 788, 795, 802, 806, 
808-810, 812-814, 818-820, 823-824, 
826, 833-835, 837-839, 842, 844, 846- 
848, 850, 852—853, 855, 865, 868—872, 874, 
877, 880, 882, 885-837, 898—900, 904, 
908, 910-912, 944, 951-953, 965-967, 
969, 973, 995-997, 1002 
avainsana-analyysi 463, 495, 503, 506, 
542, 958 
kognitiivinen merkitysanalyysi 806, 813 
laadullinen analyysi 376, 413, 431—433, 
438, 489, 834 
leksikaalis-etymologinen analyysi 806, 
815, 817, 826 
monimuuttuja-analyysi 541, 551 


multimodaalinen analyysi 360, 806, 
823-824, 903 
määrällinen analyysi 433, 806, 824, 840 
perinteinen lingvistinen analyysi 413 
sosiolingvistinen variaationanalyysi 806, 
818-819, 886 
tekstianalyysi 457, 806, 822, 831, 833-834, 
838-841, 844, 850, 853, 973 
tilastollinen analyysi 331, 536, 825, 1013 
typologinen analyysi 806, 809-810, 814 
anatomia 323, 328 
annotointi t. annotaatio 29, 88, 308, 
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414, 429, 464, 467, 508, 533, 536, 599, 
627—632 

antiikki 215, 316, 559, 643, 648, 686, 752- 
754, 758, 762, 777-779, 784, 794-795, 804 

antropologia, ks. myós lingvistinen ant- 
ropologia 147, 168-169, 346, 349, 598, 
632, 644, 649, 672, 721-728, 7307743, 
745-746, 755, 836, 867, 897, 904, 969 

appellatiivi 801, 803-805, 807, 810, 819— 
820, 822 

areaalilingvistiikka 559, 561, 576, 601, 672 

argumentaatio 24, 40, 48-51, 53-57, 36-88, 
94, 118, 139-140, 162, 176, 223, 386, 388, 
391, 393-394, 452, 457, 844 

arkeologia 145, 449, 680, 712, 741, 743, 778, 
801, 805, 817 

arkistointi 599, 616, 628, 630—633, 908 

artefakti 358, 785-786 

artikulaatio 217, 303, 317-318, 321-324, 
326-328, 332, 341 

asennoituminen 164, 881, 899, 917, 920 

aspekti 39, 108, 147, 164, 320, 341-342, 546, 
601, 608, 610, 641, 647, 753, 1018 

assosiaatiotehtävä 999 

astevaihtelu 60, 206, 693, 694-695, 710 

attribuutio 795 

auktori 795 

Australia 25, 165, 466, 573, 608, 624, 654, 
689, 725-726, 735, 879 

avoin tiede t. open access 21, 165 


B 

Basic Linguistic Theory, ks. peruskielioppi- 
teoria 

behaviorismi 218—219, 391, 454 

biologia 49, 63-64, 67, 120—121, 123, 125- 
126, 137, 139, 168, 219, 428-429, 511, 528, 
669, 671, 740, 757, 986 


D 

data 2, 5-6, 21-22, 76, 95, 97, 129, 158, 164, 
170, 177, 179, 181-182, 184-185, 224, 226- 
227, 298, 316, 329-330, 461, 464, 471-472, 
515-516, 533-535, 539, 618, 627-628, 631, 


633, 659, 710, 759, 783, 994, 996-997, 
1009-1010 

datasessio 912 

deduktio, ks. päättely 

deiksis 396, 610, 901 

deklinaatio, ks. myös taivutusluokka; taivu- 
tusparadigma 753 

demografia 598, 733, 866 

demotisaatio 844 

destandardisaatio, ks. myös standardisoi- 
tuminen 884 

diakronia 46, 83, 120, 143, 217, 305, 466, 

526, 530, 534-535, 569, 571, 589, 645-647, 

656, 736, 740, 760, 778, 814, 865 

dialektologia 244, 247, 275, 277, 293, 302, 

305-306, 760, 867-868 

dialogisuus 315, 353, 382, 406, 846, 851— 

852, 963 

diglossia 866 

dilemma 69-71 

diskurssi 17, 33, 147, 375, 377, 379-381, 385, 
388, 392—393, 396, 400, 421, 451, 493, 
495, 641, 745, 823, 836, 840, 844, 847- 
849, 852, 881, 902, 959, 966, 985, 1015 

diskurssianalyysi 17, 195, 374-396, 399-401, 
405-407, 779, 806, 822, 901, 952 
korpusavusteinen diskurssianalyysi 387 
kriittinen diskurssianalyysi 380—381, 383, 

387—388, 393-394, 396, 399, 826, 969 

diskurssikuvio 844, 847-849 

diskurssintutkimus 138, 147, 195, 306, 379- 
380, 383-384, 387, 395, 463, 834, 838 

distinktiivinen piirre 758 

distribuutio 231, 757 

diversiteettilingvistiikka 597, 672 

dokulekti 659 

dualismi 63-65, 81, 444 

dubbaus 943, 951 


E 

ediittori 789 

editio 529, 777, 785, 787-792, 794, 796 

edustavuus 20, 294, 469-470, 477, 527, 
530-531, 617, 993, 999 


EEG (elektroenkefalografia), ks. aivosäh- 
kökäyrä 

eettisyys, ks. myös etiikka 362, 993 

olingvistiikka 147, 725 


oO 


ekonomia 669-670 

eksperimentti 85-86, 88, 96, 158-159 
ekvivalenssi 947 

eliminativismi, ks. myós nihilismi 66, 
71-72, 85 

isitaatio t. elisitointi, ks. myós kirvoitus 


oO 


4, 20, 139-140, 210, 225, 278, 280, 607, 
622-627, 659, 729, 732 
elollisuus 422-424, 426, 667, 1009 
emergenssi 64—66, 72, 109, 133, 151, 907 
empiria t. empirismi 12, 24-25, 49, 56, 
58-59, 74-78, 84, 91, 97, 108-109, 115, 117, 
123-125, 132, 139-142, 159, 174, 177, 195; 
201, 214, 216, 224—228, 244, 260, 314, 316, 
318, 322, 357, 374, 446, 461-462, 487-488, 
526, 584, 639—641, 643, 646, 726, 729, 
732, 737, 839-840, 865, 899-901, 949 
enemmistókieli 684, 818, 878 
episteemisyys 65, 208, 224, 227, 392, 624, 


920, 922 
epistemologia, ks. myós tieto-oppi; tieto- 
teoria 52, 113, 217, 349, 446, 846, 855 
epásana 1000-1001, 1007 
epäsymmetria 351, 922—924 
ERP (engl. event-related brain potential) 
1006-1007 
esipilotti 255, 257 
Etelä-Amerikka 573, 624, 654, 726 
etiikka 1, 41-42, 95-98, 158-160, 162, 164, 
167-170, 173, 185, 865, 993 
hyve-etiikka 162, 164 
hyötyetiikka 162 
laajan vastuun etiikka 97, 158, 165, 169—171 
makroetiikka 158, 161, 173, 176 
mikroetiikka 41, 158—159, 162, 176, 
179-180 
seurausetiikka 162, 164 
teknologian etiikka 179 
tieteen etiikka 95, 127, 159-160, 162, 178 
tutkimusetiikka 4, 23, 30, 95, 97, 158, 160, 
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162, 165, 171, 174-181, 184, 192, 367, 631, 
658 
velvollisuusetiikka 162-164 
etnisyys 97, 165, 723-724, 740 
etnografia 276, 345-346, 348-353, 356-359, 
361—365, 367—368, 378, 386, 598, 620, 838, 
870, 885-886, 910, 965-966, 968-970, 
973 
lingvistinen etnografia 138, 147, 345-348, 
350—355, 359, 365-368 
monipaikkainen etnografia 357, 364 
puheen etnografia 350—351, 378—379, 866 
verkkoetnografia 347 
etnolingvistiikka 131, 645, 724, 728-730, 
746 
etnologia 724, 727 
etnometodologia 346, 381, 866, 870, 899 
etnos 740 
etualaistaminen 386, 393 
etymologia 209, 559, 681, 687, 689, 691, 
705, 710, 752, 777, 805-806, 811, 815, 817, 
826 
Euraasia 568, 645, 654, 708, 730, 747 
evidenssi 25, 44, 56, 58, 60, 77-78, 86-87, 
226, 231, 537, 626, 647, 740, 843 


F 

faktori 250 

faktorianalyysi 264, 541 

falsifikationismi 77-78 

falsifiointi, ks. myós kumoaminen 27, 46, 
59, 77-78, 452 

filologia 680, 735-736, 776-789, 792-797, 
835 
englantilainen filologia 780 
espanjalainen filologia 780 
germaaninen filologia 780 
italialainen filologia 780 
klassinen filologia 195, 792, 794-795 
kreikkalainen filologia 780, 786 
latinalainen filologia 780 
materiaalinen filologia 785-786, 788, 792 
pohjoismainen filologia 780 
portugalilainen filologia 780 
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ranskalainen filologia 780 
uus-, uusi filologia 780, 785 

fMRI, ks. funktionaalinen magneettikuvan- 
taminen 

fokalisointi 391 

fokusryhmä 969, 971-972 

fonetiikka 6, 22, 54, 113, 174, 195, 205, 279, 
298, 304—306, 313-321, 324, 329-330, 332, 
336, 342, 546, 573, 627-630, 632, 641, 
682, 709, 733-734, 868, 902-903, 905, 
910 
akustinen fonetiikka 314, 320 
artikulatorinen fonetiikka 320—321 
auditiivinen fonetiikka 320, 338 
vuorovaikutuspuheen fonetiikka 905 

fonologia, ks. myös äänneoppi 54, 120, 
193, 195, 205, 229, 260, 285, 316, 375, 
546, 552, 566, 585, 588, 607, 627, 641, 681, 
687—688, 694, 712, 735, 754-755, 758, 760, 
762-763, 866, 868, 902, 1018 

foreigner talk 569 

formaalitiede 42, 54-58, 60, 73, 83, 94, 98 

frekvenssi 123, 296, 333, 463, 491-493, 
495-498, 500-504, 510, 514, 516, 518-519, 
527, 533, 537-541, 543-544, 549—551, 
647, 656, 658, 663, 668, 670, 906, 957, 
991-992, 1011 

fundamentalismi 70 

funktio 16, 49, 118, 120-122, 126, 137, 143, 
149, 170, 341, 336, 339, 389, 396, 405, 501, 
516—519, 573, 580, 600, 608, 610-611, 
624, 647, 651—652, 671, 712-713, 767-768, 
807-810, 814, 816, 819, 822-823, 836, 838, 
865, 880, 885, 906, 946-947, 957, 1018 

funktionalismi 4, 12, 67, 90, 92, 108-109, 
115, 120-122, 128, 135-136, 138, 148, 381, 
383, 391-392, 454, 606, 609, 639, 645- 
649, 652, 663, 665, 669, 671-672, 750, 
767, 787, 805, 807, 809-810, 813, 836, 838, 
845, 850-851, 866, 902-903, 947-948, 
950, 987, 989-990, 1018 

funktionaalinen magneettikuvantaminen 
(fMRI) 1005, 1019 


G 

genealoginen luokittelu, ks. myös kielisuku- 
laisuus 654 

generativismi, ks. myös kielitiede > genera- 
tiivinen 59, 90, 109, 132, 648-649 

genre, ks. myös tekstilaji 285, 382, 396, 418, 
470, 476, 478, 530, 533, 537, 541, 779, 783, 
793, 838, 840, 843-845, 848-850, 852, 855 

glossaus 627, 629 

glossaussääntö 629, 661 

grammaatikko 215, 753, 777 

grammatikalisaatio, ks. myös kieliopillistu- 
minen 146, 687, 711 

grammi 133, 424—427, 433, 437, 501-502 


H 
haastattelu 4, 8, 15, 17, 20, 28-29, 194, 
231, 244, 275-283, 285-286, 289-293, 
295-303, 305-307, 346, 358-359, 365-366, 
381, 383, 386, 419, 451, 466, 569, 617, 
620—622, 632, 731-733, 818, 821, 826, 831, 
834, 838, 842, 853, 865, 871, 874, 876, 881, 
926, 944, 953, 966, 969, 970-972 
puolistrukturoitu haastattelu 275-276, 
289, 301 
fokusryhmähaastattelu 969 
sosiolingvistinen haastattelu 274, 279— 
281, 286 
strukturoimaton haastattelu 275—276, 
289, 301 
strukturoitu haastattelu 17, 275-276, 289, 
296, 301 
teemahaastattelu 276, 280, 289, 301, 874 
havainnoijan t. observoijan t. tarkkailijan 
paradoksi 260, 284, 315, 366, 621 
havainnointi t. observointi 12, 18, 20, 29, 
86, 88, 91, 142, 207, 212—213, 228, 317, 
320—324, 326, 358-359, 386, 430, 435, 
488, 528, 619, 731-732, 749, 765, 768-769, 
771, 793, 831, 834, 838, 853, 871, 944, 966, 
969-970 
kielen havainnointi 768 
naturalistinen havainnointi 4-5, 17-18, 20, 


43, 225, 229 


osallistuva havainnointi 275, 620, 732, 
969 
hermeneutiikka 81-82, 87, 115, 122 
hermeneuttinen keha 454 
heräteasetelma 1001, 1008 
heratepotentiaali 1006 
hidas lukeminen 786-787, 793, 796 
hierarkia 163, 395, 667, 717, 739, 886, 1012 
historia 2, 4, 12, 50, 56, 65, 90, 92, 116, 122, 
128, 143-145, 147, 150, 158, 161, 165, 169, 
171, 183, 192, 194, 203, 215, 242, 277, 289, 
307, 315-316, 322, 324, 352, 355, 366-367, 
375-377, 379-381, 394, 415-416, 418, 446, 
450, 454, 461, 463, 471, 479, 491-492, 
525-534, 536—537, 539-542, 544-545, 549, 
551-552, 558-559, 561, 571-573, 575-576, 
579-583, 585-589, 597-599, 601, 606, 
620—621, 640, 642—643, 645, 647-648, 
655, 663, 669—670, 672, 679-682, 
686—692, 695-696, 699, 705, 708-712, 
714, 717, 722, 725, 728-731, 733, 735-737, 
740, 750, 752, 756, 758, 777-779, 781-785, 
787-788, 792-793, 795-796, 800, 802, 
805, 815-817, 832, 835, 838—839, 865-866, 
869-870, 877—878, 880, 887, 899, 942, 
945-948, 950—951, 958, 973, 988 
esihistoria 145, 571, 573, 685-686, 708, 
717, 740, 746 
kielihistoria 418, 437, 563, 571, 583, 680- 
681, 687, 690, 712, 740, 747, 754, 778, 
787, 805, 815, 817 
muotohistoria 681, 710 
oppihistoria 779 
äännehistoria 145, 150, 571, 681, 691, 696, 
836 
historiantutkimus 50, 552, 944 
homonyymi 91, 443, 804 
humanismi t. humanisti 15-16, 33—34, 57, 
81, 96, 159-160, 182, 259, 307, 342, 729, 
781 
hypokorismi 812 
hypoteesi 12-13, 24, 27-29, 46, 77-78, 86, 
96, 124, 140, 146, 209, 232—233, 242, 247, 
253, 260, 263, 338, 358, 385, 394, 451, 461, 
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489, 527, 540-541, 549, 550, 563, 576-577, 
590, 699, 708, 738, 765, 873, 957-958, 
965, 987, 990, 992, 994-995, 1003, 1012, 
1017, 1019 

nollahypoteesi 27, 540-541, 567, 987, 995 
selityshypoteesi 24, 26, 43, 46, 124 
tutkimushypoteesi 24-25, 27-28, 225, 987 
työhypoteesi 25-28 


l 

identiteetti 112, 130, 147, 170, 183-184, 316, 
332, 393, 582, 606, 680, 683, 724, 730, 
739-740, 781, 793, 802, 806, 819, 822, 
855, 873 
ammatti-identiteetti 787, 792, 969 
diskurssi-identiteetti 393, 881 
kielellinen identiteetti 347, 571, 870, 882 
sosiaalinen identiteetti 348 

ideologia 48, 147, 213, 347, 351, 353-356, 
366, 387, 794, 822-823, 834-835, 838, 855, 
882—883, 946, 952-953, 958 
kieli-ideologia 352, 870, 884, 932 

idiografinen 50-51 

idiolekti 146, 148, 210, 223, 304, 617, 872, 
876 

ikonisuus 405, 646, 669-670, 905 

ikä 60, 112, 116, 146, 173, 185, 246, 254, 264, 
280, 291-294, 300, 340, 357, 433, 530, 
549, 584, 617, 631, 687, 701, 706-707, 717, 
724, 731, 742, 784, 794, 811, 815, 818-819, 
823, 867-869, 872, 874, 876-877, 882, 
986, 991, 998, 1010-1011 

implikaatio 12, 39-40, 67, 110, 114, 394, 457, 
665, 786, 997 

indeksisyys 46, 147, 355, 870, 879, 906-907, 
916 
sosiaalinen indeksisyys 351, 353-355, 365, 

885-886 

induktiivinen päättely t. induktio, ks. päät- 
tely 

induktivismi 74—75 

informaatio 5, 44, 47, 76, 81, 96, 126, 159- 
160, 172, 175, 179-180, 305-306, 330, 336, 
341, 391, 447, 452, 490, 498, 502, 515, 543, 
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610, 736, 809, 823, 950, 964, 1006-1007 
informaationkulku 831, 837, 844—845, 854 
informantti, ks. myös kielenopas, kielimes- 

tari 172, 274, 277, 280, 282—289, 291-296, 

299-303, 326, 333, 616, 627, 731, 874, 879 
institutionaalisuus 360, 385, 388, 395, 

452, 779, 819-820, 849, 881, 908, 912, 

916-917, 919, 921, 969 
instrumentalismi t. instrumentalisti 49-50, 

68-70, 78 
intensio 72, 93, 445, 456 
internet 159, 160, 175, 177-180, 182—183, 185, 

200, 293, 305, 387, 397, 429, 446, 468, 

472-473, 478, 502, 509, 533, 535, 622, 732, 

784, 818, 825, 897, 957, 969, 994 
intertekstuaalisuus 382, 389, 396, 398, 793, 

837, 844-845, 851-852 
introspektio 16, 140, 201, 207, 212-213, 

215-219, 228-229, 260, 419, 462, 963 
intuitio 16, 24, 45, 48, 50, 59, 132—133, 139- 

140, 201—202, 208-209, 213, 215-218, 227, 

448, 461, 488, 528, 590, 912, 949 
invarianssi 119—121 
IPA (kansainvälinen foneettinen aakkosto) 


629, 733, 910 


J 


johtaminen (sananmuodostuskeino) 685, 
768, 812 

jäsennin, ks. myös parseri 467, 488 

jäsennys 6-7, 25, 30, 48, 77, 88, 394, 427, 
430, 460, 479, 508, 753, 762, 845, 868, 
899-900, 912, 920, 922, 925, 1012, 1014 
korjausjäsennys 900, 923 
sekvenssijäsennys 900 
vuorottelujäsennys 900 


K 

kaksikielisyys, ks. myös monikielisyys 568, 
570—571, 586, 684, 732—733, 742, 818, 878, 
956, 959, 985-986 

kansanlingvistiikka 214, 277, 305-306, 821, 
826, 869, 882-883 

kantakieli 60, 144—145, 560, 563, 581, 688, 


691, 700-703, 705, 709, 716-717, 736, 
740-741, 755, 760 

kasvojen uhkaaminen 395 

kategoria 12, 16, 22, 29, 49, 57-59, 68, 72, 
77, 88, 93, 118, 120, 123, 132, 147-148, 
158, 161, 163, 176, 178, 182, 184-185, 187, 
216, 223, 319, 339-340, 375, 379, 419, 421, 
430-431, 435, 445-447, 452, 454-456, 462, 
467, 512, 527, 531—532, 537, 544-546, 550— 
551, 566—568, 603, 606-608, 611, 613, 
625, 629, 641, 646, 648—652, 667, 672, 
737-738, 751, 757-758, 761-766, 768-769, 
785, 800, 802, 808-810, 813-814, 820, 
852, 882, 896, 898, 903, 952, 973, 1011 

kategoriakäsitys 647, 650 

partikularistinen kategoriakäsitys 
648—650 

universalistinen kategoriakäsitys 648 

ategorisaatio 22, 57, 88, 338, 395, 533, 754, 

768, 822, 899 

atse 31, 106, 181, 212, 297, 324, 365, 401, 

403, 669, 855, 904, 913, 915, 964, 1005 

ausaatio 40, 79-81 

ehollisuus 384, 401, 405, 898, 901, 903- 

905, 912—913, 915-917, 920, 924, 926, 948 

enttámuistiinpano 733 

enttäpäiväkirja 359, 365, 615 

enttätutkimus 96, 163, 168, 172, 275, 623, 

966, 969-970 

enttätyö 244, 348, 350, 356, 359, 361, 363, 

416, 570, 590, 596—600, 603-605, 607, 

613-622, 627—628, 630—631, 633, 657, 

726-736, 743, 746-747, 824, 873, 910 

kerronta, ks. myös narratiivi, tarina 276, 
286, 382, 391, 620, 822-823, 906, 952 


keskustelu 10, 15-16, 20, 25, 33-34, 43, 54, 
58-59, 70-71, 87, 108-110, 115, 118-119, 
126-127, 132, 138, 151, 159, 161, 165, 169, 
175, 180-181, 184, 193, 200-201, 206-207, 
225, 229, 245, 251—253, 261, 266-268, 276, 
279-282, 285-286, 290—291, 295, 299, 
301-302, 304, 342, 347, 354, 358-359, 362, 
366, 377, 379, 383-388, 390, 394, 396, 
398-402, 405, 418, 450, 473, 488, 490, 


493, 499, 502, 507-510, 530, 569-570, 
578, 583, 589, 602, 607, 616, 618—621, 
624-625, 632, 648, 655, 669, 744, 747, 
756, 759, 783, 792, 820-822, 833-834, 
836, 848-851, 854, 866, 869-870, 
874-875, 880, 885, 897-898, 900-902, 
904-905, 908, 912, 916, 919-922, 925, 
946, 949, 957, 963, 970, 972 
arkikeskustelu 417-418, 462, 466, 820, 
909, 924 

kirjoitettu keskustelu 898 

keskustelunanalyysi 76, 138, 147, 194, 346, 
366, 379, 381, 401, 413, 820, 836, 854, 
881, 886, 896-908, 910—912, 919-920, 
922—923, 925-926, 952, 967 

kieleily (engl. languaging) 354, 571 

kielellinen monimuotoisuus, ks. kielten 
monimuotoisuus 

kielellinen käänne 381—382, 835 

kielellinen relativismi t. lingvistinen relati- 
vismi 737—738, 755, 766, 866 

kielellinen yksikkö 139, 217, 321, 764, 767, 
907, 957 

kielen dokumentaatio t. dokumentointi 32, 
417, 596, 598-599, 601-602, 604-605, 
621, 623, 627, 630, 633-634, 672, 689, 
724, 726, 730-732, 734, 737, 743, 746, 751, 
757 

kielen elvytys, ks. myös kielen säilyttämi- 
nen; revitalisaatio 743-745, 768 

kielen ekologia, ks. myös lingvistinen eko- 
logia 598 

kielen kuvaus, ks. myös kielioppikuvaus 12, 
48, 119, 138, 148, 206, 215, 219, 222, 227, 
381, 589, 599, 601, 605-607, 611, 613, 614, 
616, 618—619, 622, 625, 651, 658, 672, 
729, 735, 749-754, 756, 762, 766 

kielen omaksuminen 62, 1012 

kielen oppiminen 62, 82, 196, 206—207, 
418, 565, 569, 585, 709, 759, 923, 925, 959, 
984-985, 988, 1012, 1015 

kielen prosessointi 670, 965, 985-986, 
989-990, 992, 994, 997, 999, 1001, 1005, 
1007-1009, 1011, 1019 
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ielen säilyttäminen, ks. myös kielen elvytys 

596, 742, 864, 871, 878-879 

ielen tuottaminen 131, 685, 944, 957-958, 

984-985, 988-989, 999, 1017, 1019 

ielen universaali 25, 49, 126, 146, 577, 581, 

643-645, 655, 664, 671-672, 737, 755 

ielen ymmärtäminen 131, 879, 984-985, 

988—989, 1019 

ielen yksinkertaistuminen 583, 586 

ielenhuolto 213, 600—601, 750, 767-768, 837 

ielenkayttéindeksi 879 

ielenmuutos 217, 526—528, 530—533, 537, 
539, 541, 544—545, 549, 551, 557, 559, 564, 
569—571, 588, 683—685, 688, 690, 865, 
871-872 

kielenopas, ks. myós informantti, kielimes- 
tari 96, 172—174, 202, 210, 283, 307, 607, 
614, 616-627, 632, 731-734, 745-746 

kielenpiirre 226, 296, 351—352, 355-356, 541, 
640, 642, 645, 653—655, 660, 663-669, 
684, 840, 870, 872, 879, 882 

kielentutkimus 1-7, 9, 12, 14-16, 18-20, 22, 
26—27, 31-34, 38-39, 46, 49, 51, 54-63, 
66-67, 71, 80, 83, 87-88, 90, 95-97, 105, 
107-109, 111, 113-115, 121, 125, 128-130, 
1347135, 137-139, 141-143, 145-147, 
149-151, 159-160, 162, 164, 168, 170, 172, 
175, 178, 182, 191-196, 199, 201, 203, 
209-219, 222-227, 234, 240, 242—247, 
252, 260—261, 275, 277, 283, 305, 307, 
329, 377-378, 383-384, 412-418, 420, 423, 
430—431, 433-435, 437-438, 442-443, 446, 
460-463, 467, 479, 494, 499, 502-505, 
519, 529, 558-559, 567, 583, 598, 632, 639, 
668-669, 671-673, 679, 727-729, 737, 
749-750, 752, 770, 777-785, 793, 797, 
833-837, 842, 855, 865-866, 887-888, 
897-898, 901, 905, 926, 952, 985-986, 
988, 990, 992-993, 995, 997-998, 1002, 
1005, 1007, 1009, 1018-1019 
deskriptiivinen kielentutkimus 672 
diakroninen kielentutkimus 143, 736, 740 
historiallinen kielentutkimus 471, 558—559, 

579, 736, 867 
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historiallis-vertaileva kielentutkimus 125, 
560, 589, 672, 679, 691, 709, 715, 729, 
736, 740, 743 

kognitiivinen kielentutkimus 3, 45, 219, 
426, 437, 489, 725 

kontrastiivinen kielentutkimus 589, 671, 
759-760, 947 

neopositivistinen kielentutkimus 732 

uskonnollispohjainen kielentutkimus 728 

vertaileva kielentutkimus 729, 736, 754 

kielenvaihto 146—147, 564, 569—570, 575, 
580, 586—587, 681, 685—686, 709, 864, 
871, 878-880, 923 

kielenylitys 884 

kieliasenne 864, 867, 871, 882-883 

kielidiversiteetti, ks. kielten monimuotoi- 

SUUS 

kielifilosofia 72, 106, 448, 450, 752, 805 

kielijärjestelmä 55, 63, 83, 108, 130, 136, 

145, 213, 217, 682-684, 751, 755, 757, 761, 

763-764, 766-767, 770-771, 800, 826, 852 

kielikontakti, ks. myös lainakontakti; mur- 

rekontakti 147, 551, 557-561, 563-565, 

567—569, 571, 573-577, 580, 583, 585-590, 

601, 620, 645, 656, 663-664, 668, 670, 

672, 681, 684, 713, 741, 818 

kielikunta, ks. myös kieliperhe 145, 526, 558, 

560—561, 563, 576—577, 601, 606, 654, 657, 

663, 665, 670, 679, 686, 688-689, 691, 

700-701, 716-717, 729-730, 736, 740-741, 

760 

kielikuolema t. kielen kuolema 570, 686, 
709 

kielikyky 62, 130, 213, 217, 220—221, 350, 
671, 766 

kielikäsitys 106, 108, 130, 132, 150, 318, 

352-353, 381-382, 406, 414, 461, 491, 

598, 755-756, 779, 905, 945, 986-987, 

989-990 

kieliliitto t. Sprachbund 147, 561—562, 564, 

568—569, 572, 574-577 

Balkanin kieliliitto 562, 566, 576—577, 586 

uralilais-altailainen kieliliitto 562 

Valimeren kieliliitto 562 


kielimestari, ks. myös informantti, kieleno- 
pas 172, 283, 616, 627 
kielimuoto, ks. myös varieteetti 113, 129, 
201, 213, 244, 284, 338, 350, 352, 374, 379, 
419, 433, 471, 557-560, 570—571, 582, 619, 
655, 659, 679—680, 686, 688, 707-708, 
717, 722, 731, 733, 740, 760, 778, 780, 785, 
793, 816-817, 866, 868-869, 872—874, 
876, 882—884, 922, 943 
kielenopas 96, 172—173, 202, 210, 283, 307, 
607, 614, 616—622, 624-627, 632, 731-732, 
734, 745-746 
kieliopillistuminen, ks. myös grammatikali- 
saatio 90, 146, 437, 545-548, 647, 687, 711 
kieliopillisuus 22, 29, 49, 126, 130, 138-139, 
144, 146, 216, 220, 227—230, 232, 380, 396, 
463, 466, 547, 566—567, 569, 572—573, 575, 
582, 586—587, 601—603, 605, 607-608, 
610—611, 621-622, 625-626, 629, 633, 
687, 690, 708, 711, 715-716, 747, 751, 754, 
759, 768, 849, 852, 866, 957, 985, 999 
kielioppi 5-6, 9, 12, 50, 56, 58-59, 62, 68, 
79, 108, 119, 130, 137, 146, 148, 199, 206, 
210, 215-216, 219—221, 227, 392, 395-396, 
418, 421, 466, 526—527, 532, 560, 572, 576, 
578, 580—587, 596, 598—613, 620, 622, 
626, 629, 633-634, 640—641, 644, 647, 
658—659, 667, 672, 680, 709, 722, 726, 
729, 731-732, 735, 738-739, 749-771, 793, 
831, 833, 844-847, 852, 854, 902-908, 
922, 926, 947, 951-952 
deskriptiivinen kielioppi 648, 750, 757 
generatiivinen kielioppi 4, 108, 219, 350, 
643, 750-751, 761-766, 769, 807, 1018 
kognitiivinen kielioppi 4, 24, 45, 69, 
91, 446, 453-454, 672, 750-751, 761, 
763-766 
konstruktiokielioppi 672, 750-751, 768 
lausekerakennekielioppi 467 
perinteinen kielioppi 648, 754, 761-763, 
766, 902 
preskriptiivinen kielioppi 750, 755 
systeemis-funktionaalinen kielioppi 4, 12, 
750-751, 767, 838 


universaalikielioppi 62, 64, 120, 132, 222, 
643, 648, 671 

kielioppikommentaari 753 

kielioppikuvaus t. kieliopin kuvaus, ks. 
myös referenssikielioppi 16, 138, 148, 
210—211, 220, 223, 584, 596, 598-605, 
607-609, 611-612, 628—629, 632—633, 
639, 656-659, 747, 750—751, 756, 758, 769 

kielioppimalli 148, 222, 478, 602, 643, 648, 
757, 761-762, 765, 771 

kielioppisääntö 751, 767, 836—837 

kielioppiteoria 12, 210, 219, 601-602, 607, 
648, 653, 658, 672, 735, 758, 761-763, 765 

Kielipankki 20, 307—308, 423, 436, 461, 
472-473, 476, 507, 534, 535, 630-631, 734, 
842, 887, 909 

kieliperhe, ks. myós kielikunta 579, 581, 
654-656, 663, 755 

kielipesà 744 

kielipolitiikka 150, 824, 866 

kielisosiologia 146, 570, 606—607, 620, 865, 
867, 878, 880, 886 

kielisukulaisuus, ks. myós genealoginen 
luokittelu; kielten sukulaisuussuhde 
560—561, 563, 574, 577, 582, 645, 654, 656, 
663—664, 668, 681, 728 

kielitaito 53, 146, 203, 212—213, 244, 569, 
589, 614—616, 626, 744, 776, 793, 879, 
923, 998 

kielitaju 4, 16-18, 49, 57, 59, 110, 132-133, 
138-140, 199-219, 221—234, 244-245, 253, 
259-260, 406, 417, 434, 462, 499, 502, 
528, 616, 626 

kieliteknologia 32, 467, 494, 630, 768, 973 

kielitiede t. lingvistiikka, ks. myós kielentut- 
kimus 1-3, 6, 16-18, 33, 43, 48-50, 57-60, 
62—64, 73, 76, 87, 105, 109-112, 114-115, 
118—124, 131, 134-135, 139-140, 143, 150- 
151, 158-160, 167, 169-171, 173-174, 178, 
180, 184, 195, 203, 212, 216—217, 221-222, 
228, 233, 241, 243-247, 252, 258, 270, 
277-278, 290, 294, 296, 298, 307, 313-316, 
319, 342, 365, 375, 377-378, 380-384, 391, 
446, 450, 457, 462, 499, 506, 511, 519, 
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530, 549, 551—552, 557, 559-561, 564—565, 
578, 585, 588, 597-598, 600, 606, 619, 
628, 632—633, 640—649, 658, 661, 672, 
679, 690, 717, 721-723, 725, 728-734, 737, 
741, 743, 749-747, 752, 755-756, 760, 764- 
765, 778, 782-783, 785, 788, 800, 826, 837, 
866, 904, 916, 926, 944, 947-948, 950, 
985—986, 988, 990, 1015, 1018 
antropologinen kielitiede 147, 168, 193, 
346, 598, 632, 649, 672, 722-747 
deskriptiivinen kielitiede 598, 610, 648, 
672, 755 
dokumentoiva kielitiede 596—598 
generatiivinen kielitiede, ks. myös genera- 
tivismi 3, 62—63, 130, 137-138, 221-222, 
462, 491, 647, 671-672, 757, 762-763, 
990 
historiallinen kielitiede 217, 528, 567, 601, 
680, 686—687, 715, 755, 782 
komparatiivinen kielitiede 754, 760 
typologinen kielitiede 759 
yleinen kielitiede 195, 217, 641, 646, 673, 
743, 1018, 1020 
kielitieto 57, 59, 97, 172, 213-214, 750 
kielitietoisuus 213-214, 750, 882, 888 
kielitypologia t. typologia 4, 16, 88, 121, 
126-127, 146, 195, 437, 559, 562, 566, 572, 
577, 581, 583, 586—587, 589, 597, 602-603, 
605, 607-608, 610-611, 623, 632, 639— 
651, 653-663, 665-673, 715, 717, 722, 729, 
735, 737-738, 743, 751, 757, 759-760, 769, 
805-807, 809-814, 826, 837, 958, 1011 
dynaaminen typologia 647, 654, 656 
fonologinen typologia 641 
holistinen typologia 666 
leksikaalinen typologia 641, 646 
morfologinen typologia 607, 643-644, 662 
sanajärjestystypologia 662 
kieliyhteisö 55-56, 68, 119, 125, 132, 147, 163, 
168-172, 178-179, 211, 213, 223, 338, 350, 
449, 526, 528, 530, 565, 598, 601, 606, 
613, 615, 619, 631-633, 661, 681, 685, 689, 
772, 724-725, 731, 733, 7397743, 745-746, 
750, 814, 845, 865, 873, 883-884, 922 
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kielten sukulaisuussuhde, ks. myös genea- 
loginen luokittelu; kielisukulaisuus 145, 
647, 657, 679, 755 

kielten monimuotoisuus t. kielten diversi- 
teetti, ks. myös superdiversiteetti 147, 191, 
193, 597, 599, 639, 654, 686 

kielten uhanalaisuus 725, 741—742, 747 

kieltenvälinen vertailu 641, 651—652, 
671—672, 956 

kiintopiste 325, 422—423, 426-427 

kirjakieli 418—420, 423, 563, 684—685, 689, 
692, 694, 744-745, 750, 803 

kirjoittaja 21, 34, 63, 92—93, 191, 218, 227, 
384, 397-399, 448, 453-454, 460, 464, 471, 
479, 493, 508, 529-530, 533-534, 538, 550- 
552, 601—602, 604-605, 607-608, 612, 
644, 768, 779, 785-786, 789, 793, 795-796, 
803, 834, 837-838, 845, 848-849, 851 

kirjoittaminen 4—5, 106, 267, 367, 391, 436, 
542, 598—605, 613, 615, 620, 627-629, 
633-634, 662, 736, 751, 757-758, 792, 838, 
854-855, 901, 904, 944, 962, 997, 1015 

kirjoitusjärjestelmä, ks. myös ortografia 
145, 316, 338, 360, 601, 628-629, 733, 
735-736, 744-745 

kirjoitustulkkaus, ks. tulkkaus 

kirvoitus, ks. myös elisitaatio 627 

kodikologia 788, 792 

koeasetelma 23, 29, 46, 85, 88, 340, 842, 
965, 971, 987-988, 990-997, 1002, 1009- 
1010, 1020 

koehenkilö 174, 317, 321—323, 326—327, 329- 
331, 338, 340-341, 842, 986-987 

koetilanne 965, 987—988, 990-994 

kognaatti, ks. myós vastine 692, 760 

kognitio 67, 81, 91-92, 108, 120, 213, 226, 
502, 528, 671, 765, 944, 948, 965, 986- 
987, 990, 1016, 1019 

kohdekieli 589, 613, 733-734, 792, 952, 
957—959, 967, 1010, 1012 

koheesio 391, 837, 844-845, 957 

koherenssi 48, 52—53, 69—70, 72, 90-91, 93, 
110—111, 114, 124, 229, 391, 398, 442-443, 
447, 450, 453, 456, 845, 854, 900, 1017 


kollokaatio 23, 392, 434, 471, 496-498, 501, 
542, 716, 768, 957 

kompetenssi 62, 213, 219-221, 226, 350, 
723, 731-732, 819, 898, 952, 959, 962-965 

kompleksisuus, ks. myós monimutkaisuus 

65, 121—122, 134, 181, 202, 233, 321-322, 

342, 368, 506, 533, 583-586, 662, 726, 

779, 809, 814, 946, 964, 1003 

ongruenssi 129, 206, 625, 739, 752—753, 

1003, 1011, 1014 

onkordanssi 474—475, 535 

onseptualismi 68, 123 

onstruktio 48, 53, 87, 129, 131, 147, 426— 

427, 497, 545-548, 652, 812 

onstruktivismi 70, 82, 835, 842, 853 

ontaktialue 559, 562, 564, 574 

ontaktikieli 560—561, 577—578, 581—583, 

585, 587 

ontaktilingvistiikka 580—581, 681, 709 

ontaktivaikutus 566, 568, 582, 589, 958 

onteksti 11, 56-57, 69, 72, 87, 95, 97, 138, 

160, 163, 169—170, 172, 174, 202, 205, 

227—228, 260, 323, 340—341, 349, 352-354, 

356—357, 364, 366, 375, 382, 386, 391, 

394—395, 400-401, 414, 425, 427-428, 

437, 454, 457, 478-479, 496, 529-530, 

535, 545, 584, 606, 622-624, 641-643, 

645, 682-683, 691-692, 694, 698-699, 

707, 709, 711-712, 714, 722, 726, 728, 

732, 737, 741, 767, 776, 788, 793, 796-797, 

803-804, 806, 820, 832-836, 838-840, 

846-847, 849, 865, 870, 880, 905-907, 

909, 916-917, 919, 923, 925-926, 946, 

950, 969, 1007 

kielen konteksti 23, 70, 423, 478, 722, 
731-732, 737 

kulttuurikonteksti 478, 623, 713—714, 724, 
731, 842, 845, 855 

käyttökonteksti 285, 387, 415, 505, 547, 
549, 602, 633, 786, 796, 802, 906 

sosiaalinen konteksti 389, 400, 563, 724, 
731, 845, 855, 963, 968 

syntykonteksti 776, 786 

taloudellinen konteksti 786 


tilannekonteksti 351, 353, 364, 378-379, 
836, 839 
kontekstuaalisuus 79, 137, 218-219, 274, 
280-281, 351, 353, 355, 382, 391, 405, 447, 
722, 724, 731, 788, 834, 838-839, 844, 
846, 907 
kontekstualisointi 353-355, 359, 625, 793, 
902 
kontingentti 55—56, 59, 540 
kontrollitilanne 992, 1010 
kontrollointi 210, 988, 993 
konventionalisti 68—69 
konvergenssi 380, 574—575 
koodaus t. koodaaminen 179, 227, 419, 
421-424, 426-427, 429-433, 465, 922 
koodinvaihto 147, 565, 568, 570—571, 866, 
880-881, 932 
korjaus 43, 46, 54, 219, 328, 401, 900, 912, 
923, 953, 964 
korpus', terminologia 6, 15, 17, 24, 76, 88, 
110, 135, 140, 144, 184, 199, 201, 219, 223, 
230—232, 308, 387, 414, 417, 420, 435, 437, 
460-473, 475-479, 488-492, 494-496, 
498, 502, 514—515, 527, 529-543, 545, 
548—552, 570, 598, 619, 627, 632-633, 
639, 646, 658—659, 734-735, 785, 795-797, 
824—825, 887, 944, 950—951, 955-959, 967 
diakroninen korpus 466, 530, 534 
historiallinen korpus 463, 528—529, 531— 
532, 534-535, 542 
käännöskorpus 955-956, 959 
puhutun kielen korpus 463, 887 
rinnakkaiskorpus 639, 658—659, 955-957, 
959 
synkroninen korpus 530, 534—535 
verrannollinen korpus 955-957 
yleiskorpus 465-466, 470-471, 488, 491, 
530 


korpus?, aineistot 14, 24, 29, 88, 140, 


223-224, 227, 423, 435, 460, 494, 497, 
527-528, 530, 533-536, 538—539, 542—545, 
549—552, 887, 956, 960 

Akateeminen Suomi korpus 463 

Arkisyn korpus 462, 466, 909 
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B-Brown korpus 462, 531 
B-LOB-1931 korpus 462, 531 
British National Corpus korpus 465, 470, 
488 
Brown Corpus of Contemporary American 
English korpus 462-463, 491, 531 
Edistyneiden suomenoppijoiden korpus 463, 
470 
F-LOB korpus 462, 531 
Frown korpus 462, 531 
Helsinki Corpus of English Texts korpus 
463, 466, 532 
Internet Parsebank korpus 468 
Kansalliskorpus 465 
KORP 461, 473-474, 535 
Lancaster-Oslo-Bergen (LOB) Corpus 
462-463, 531 
Lauseopin arkiston murrekorpus 423, 462, 
466 
Penn Treebank korpus 467 
Suomi24 korpus 475, 493, 507, 509, 511 
Turku Dependency Treebank (TDT) korpus 
467 
Universal Dependencies korpus 467—468 
WaCky Corpora -aineistot 468 
korpuslingvistiikka 88, 376, 462—463, 487, 
489, 491-492, 494-495, 498-499, 506, 
514, 519, 525-530, 533-534, 537, 540-542, 
544-545, 549, 551-552, 783, 794, 796, 840, 
951, 955-957, 959 
korpusmanuaali 477 
korpustyökalu 387, 461, 463-464, 472, 507, 
536 
Kotimaisten kielten keskus 307, 416, 423, 
464, 466, 876, 887 
koulukunta 3, 16, 39, 49, 53, 57, 64, 71-72, 
75-76, 89-91, 93, 108-109, 135, 138-142, 
151, 384, 389, 447, 450, 454, 643-644, 
726, 729, 734, 749, 755, 757, 761-762, 850, 
1018 
kreoli t. kreoloidi 147, 560-561, 578-581, 
583, 585 
semikreoli 581, 587 
kreolisaatio t. kreoloituminen 579-581, 866 
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kriittinen apparaatti 789, 791 

kulttuuri 31-33, 55, 58, 70, 95, 127, 147, 
163, 175, 183, 193, 195, 207, 213, 222, 307, 
347-349, 353, 354, 357, 376, 384, 391, 
394—395, 400, 447, 492, 495, 561, 572, 
597—598, 600—601, 606, 615-616, 618, 
623—623, 632—633, 643, 645, 661, 669, 
671, 680-681, 683-684, 686, 705, 714, 
716, 721-727, 730, 737, 739-745, 750, 
757, 765, 778-780, 783-784, 786, 789, 
792—794, 811, 816, 820, 825, 831-834, 
836—842, 849, 851, 853, 855, 866—867, 
870, 875, 900, 921-922, 926, 944, 946 
948, 951-952, 968, 970 

kumoaminen, ks. myós falsifiointi 24, 27, 
55—56, 60, 78, 250, 541, 585, 665, 839, 876 

kuvauskategoria 651 

kysely 8, 17, 20, 24, 28-29, 76-77, 88, 139, 
141, 174, 182, 192, 196, 210, 223, 225, 
231, 240—248, 251—255, 257-262, 264, 
266-270, 275, 278-279, 419, 432, 436, 
528, 639, 659, 732-733, 838, 883, 944, 
966, 969, 971-972 

kyselykaavake 660, 733 

kyselylomake t. lomake 240—242, 247-248, 
250—255, 257, 259, 262—263, 265-266, 
268-269, 399, 623, 659, 821 

kásiala 304—305, 533, 788, 792 

käsikirjoitus 680, 785-786, 788—792, 
794—796, 997 

kásiterakenne 137, 562, 764 


käsitteenmuodostus 53, 92-94, 447 

käytettävyys 50, 615, 658, 821, 970 

käytänne 30, 165, 193, 216, 297, 299-300, 
347-348, 356, 358-359, 361, 364, 367, 533, 
557, 568-569, 571, 589, 599, 750, 789, 834, 
836, 838, 842, 851—853, 855, 867, 870, 898, 
903, 906-909, 911, 920-926, 968 

käännös 194, 257, 418, 448, 531, 550, 598, 
625-629, 633, 658, 755, 768, 788, 924, 
942—943, 945-949, 951—953, 955-959, 
962—966, 968-971, 973 

kääntäjäkompetenssi t. käännöskompe- 
tenssi 952, 959, 964—965 


äännösprosessi 948-949, 952—953, 958, 
962-966 

äännösstrategia 952, 962 
äännösteknologia 945, 949, 973 
äännösteoria 947—950 

äännöstiede 781, 942—951, 953, 955-956, 
959, 964, 968-970, 973-974 
kognitiviinen käännöstiede 948 
äännöstutkimus 943-944, 946, 950, 
962-965 

deskriptiivinen käännöstutkimus 947—948 
äännösuniversaali, ks. myös kääntämisen 
universaali 948 

ääntäjä 133, 942, 944-945, 948-949, 951- 
952, 958-959, 962-966, 968-970 
ääntäminen 4, 194, 625, 781, 923-924, 
942-953, 957-959, 962-966, 968-970, 
973 

av-kääntäminen 194, 943, 949 


intersemioottinen kääntäminen 943, 949 
kielensisäinen kääntäminen 943 

kääntämisen universaali, ks. myös käännö- 
suniversaali 957—958 


L 

laina 125, 145, 147, 558, 560, 566-569, 571- 
572, 576, 681, 684, 691, 694, 705-708, 
713, 715-716, 804 
käännöslaina 429, 576 

ainaaminen 396, 586, 681, 684, 706-707 

ainakontakti, ks. myös kielikontakti; murre- 
kontakti 679, 708 

ainanantajakieli 574, 705, 707, 711 

ainansaajakieli 560, 706-707 

ainasanasto 558, 560, 684, 705-709 

ainaussuunta 567 

ainautuminen 559, 563, 567—570, 574—576, 
588—589, 684, 691, 707, 713, 715-717 

ainautumisaika 572 

ainavaikutus 566, 717 

ainomainen 49—50, 79-81, 115-118, 120, 
124-127 

aki 20-21, 49, 55, 64, 66, 74-75, 79-81, 
111, 114-120, 122-128, 133, 163-164, 172, 


178, 185, 399, 531, 691-695, 752, 780, 951, 
957, 993 

languaging ks. kieleily 

Lauseopin arkisto 307—308, 419, 423, 425, 
462, 466 

lauserakenne 4, 603, 608—610, 684, 713, 
737, 753, 756, 762—763, 770, 907, 1003, 
1008, 1012 

lausuma 23, 204, 332, 881, 901, 906 

legitimaatio 393 

leksifioija 560, 578-581 

leksikografia 767 

leksikologia 375, 443, 779 

lekti, ks. myós kielimuoto; varieteetti; doku- 
lekti; idiolekti; sosiolekti 135, 352 

Likert-asteikko 254 

lingua franca 147, 564, 573, 578, 586 

lingvistinen antropologia, ks. myós ant- 
ropologia 138, 346, 350—351, 353, 378, 
723-724, 727, 744, 746, 902 

lingvistinen ekologia, ks. myós kielen eko- 
logia 725 

litteraatio t. litterointi 4, 6, 22, 29, 225, 227, 
297, 303-308, 334-335, 402, 615-616, 
627—629, 874-875, 908, 910, 913, 959 

lokalisointi 944 

lukija 38-39, 111, 191-192, 227, 241, 247, 
267, 269, 293, 376, 391, 436, 449, 465, 
493, 495, 498, 507, 552, 599, 601-602, 
604-605, 609, 612-613, 633-634, 661, 
762, 767, 789, 823, 832, 834, 838, 841, 
844-845, 848, 852, 865, 912, 942, 971- 
972, 986, 990 

lukupuhunta 281 

luokittelu 14, 22, 29, 51, 87-88, 129, 142, 
145, 340, 413, 415, 421, 436, 478, 489, 
502—504, 511, 536, 582, 631, 640, 642, 
644, 650, 654—655, 660—663, 751, 754, 
807-808, 810, 837, 951, 965 

luonnollistaminen 393 

luonnontiede 46, 57-58, 80-81, 115, 120, 
216, 294, 314, 342, 751, 755, 778 

luotettavuus 20, 27, 60, 201, 243, 250-251, 
305, 364, 438, 503, 658, 734, 912 
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ähdekieli, ks. myös lähtökieli 567-568, 953, 
958, 967 

ähdekritiikki 658 

ähdemateriaali, ks. myös tutkimusmateri- 
aali 650, 657—658, 660, 788, 795 

ahdetieto 424-425 

ähiluku 783, 844, 952 

ähtökieli, ks. myös lähdekieli 589 

äpinäkyvyys 21, 87, 127, 293, 364, 436, 462, 
477, 561, 584, 586, 682, 693, 804, 815, 
1010, 1014 


M 

makroalue 562, 577, 589 

makropropositio 391 

materialismi 64, 66, 72, 114, 133 

MEG (magneettienkefalografia) 1005, 1010, 
1019 

menetelmä 1-8, 11-13, 17-20, 22, 26—27, 
29-31, 33-34, 38-39, 41-42, 54-57, 88, 
105, 113, 140-141, 149-150, 191-194, 
196, 202, 209, 218, 226—227, 234, 241, 
243-246, 248, 251—252, 257, 262, 265, 
268-270, 275, 277-279, 283, 293-294, 
299, 304, 306-307, 313-318, 320, 322, 
324-327, 341, 374—375, 386—387, 389-390, 
412-413, 417, 419-421, 432, 435, 437-438, 
442, 450, 452, 454, 462, 478-479, 487- 
489, 492-496, 498, 500, 503-507, 509, 
511, 515-517, 519, 525-529, 536, 538-539, 
541-542, 545, 549-552, 557, 559, 565-566, 
577, 589, 608, 619—620, 622, 625-626, 
633, 639, 653-656, 659, 667—668, 671- 
673, 680, 716, 721-723, 729, 731-736, 740, 
744, 759, 771, 776—777, 780, 783, 788-789, 
792, 796-797, 800, 802, 810-811, 813, 
826, 831, 834-835, 839-840, 844, 850, 
854—855, 869, 871-872, 874, 877, 880, 
882—883, 886—887, 897—902, 942-944, 
949, 951-952, 958-959, 962-964, 966, 
969-973, 986-988, 992, 994-995, 997, 
999-1000, 1002, 1005-1006, 1008, 1011, 
1018-1019 
historiallis-vertaileva menetelmä 4, 90, 


1046 ASIASANAHAKEMISTO 


216, 577, 579, 589, 688-690, 699, 710, 
736 
jatkuvan mittauksen menetelma 1000, 
1002, 1008-1009 
ielihistoriallinen menetelma 437 
okeellinen menetelmä 225, 569, 965- 
966, 984-985, 993, 997 
yselymenetelmä 210, 243-246, 248, 258, 
262, 269, 419 
aadullinen menetelmä t. kvalitatiivinen 
menetelmä 14-15, 19, 241, 415, 417, 430, 
437, 463, 551, 864-865, 903 
määrällinen menetelmä t. kvantitatiivinen 
menetelmä 19, 260, 350, 359, 376, 433, 
463, 536, 551, 646, 796, 837, 864-865, 
876-877, 887, 903 
päätöspuumenetelmä 877 
reaktioaikamenetelmä 1000-1001, 1008 
satunnaismetsämenetelmä 504, 877 
tilastollinen menetelmä 4, 8, 29, 88, 141, 
196, 240-241, 254, 262, 338, 433, 435, 
478, 496, 519, 527, 541-542, 548, 551, 
653, 655, 668, 825, 877, 959, 996 
värikynämenetelmä 413 
ääneen ajattelu -menetelmä 963 
mentaalileksikko 985, 1013 


merkitysmatriisi 454, 457 

merkitysrakenne 69, 321, 380, 457 

merkityssisältö 53, 91, 250, 442—443, 446— 
447, 451, 457, 818 

merkityssuhde 392, 813-814, 845 

merkitysteoria 69, 110, 445-448, 457 

metadata, ks. myös metatieto 464, 534, 
627—628, 631 

metafora 4, 69, 82, 181, 352, 389, 393, 400, 
405, 420, 709, 715, 764-765, 814, 964 

metakieli 7, 45, 49, 111, 199, 205, 622, 646, 
648, 658-659, 732, 821, 882 

metateoria 2-4, 7, 39, 49, 59, 89-91, 105, 
108-109, 119, 132, 134, 139, 151, 193, 215, 
450, 457, 840, 855 

metatieto, ks. myós metadata 7, 21, 421, 
460, 464-465, 467, 472, 476, 493, 506, 
508, 513, 515—516, 615, 627, 631, 910 


metodi 1-8, 13, 16-18, 24, 27, 29-30, 33, 
38-41, 43-44, 47-48, 51, 54, 56, 58, 60-61, 
63-64, 67, 72, 75, 81, 83-84, 86-87, 89, 
91, 94-97, 105, 108-111, 113-114, 126, 
138-140, 142, 145, 150-151, 159-160, 
164—165, 192-195, 199, 203, 209-215, 
217-219, 222—226, 228, 231, 233, 247-248, 
269, 274-275, 277-278, 290, 305-306, 
346-348, 375-377, 379, 381, 383-384, 406, 
443, 450, 457, 529, 545, 600, 622, 626, 
644, 647, 659, 679-680, 689, 691, 712, 
717, 728-729, 753, 802, 806-807, 809, 
813, 819, 822, 825-826, 839, 853, 872, 876, 
881, 886, 898—901, 903, 909, 912, 922, 
925-926, 944, 963-965, 997, 1000 
historiallis-komparatiivinen metodi 687 
historiallis-vertaileva metodi 145, 150, 

679, 681—682, 687—691, 693, 696, 698- 
699, 705, 707, 712, 716-717 
näennäisaikametodi 872, 886 

metodiikka 3—4, 8, 38-39, 59—60, 83, 87-88, 
141, 194-195, 216, 377, 381-382, 560, 570, 
589, 604 

metodologia 1-5, 7-8, 10-12, 15-16, 38-42, 
51, 57, 60, 63, 67-68, 73-74, 82-83, 85-86, 
91, 94, 96, 98, 105, 108-109, 113-114, 

121, 129, 138-140, 142, 150-151, 164, 173, 
192-194, 215-217, 221—222, 228, 245-247, 
252, 260, 315, 317, 324, 345, 348-349, 352, 
355, 366—367, 375, 435, 461, 526, 530, 552, 
565, 567, 573, 580, 587, 588, 590, 599, 
640—642, 644, 646, 649, 651, 653, 659, 
760, 766, 787, 792, 835, 855 

minimalismi 763 

minimipari 49, 202, 231—232, 243, 280—281, 
625, 759, 770 

mittari 77, 241—242, 251—252, 504, 584, 988, 
1002, 1004 

ttaus 14—15, 57, 77, 88, 113, 173, 240—243, 

245, 251, 257—258, 265-266, 268, 298, 

306, 317, 322-323, 326-327, 331-335, 337, 

340, 584, 973, 992, 1000-1002, 1005- 

1006, 1008-1009 

m 


m 


ttausinstrumentti 263 


mittauskehikko 263-265 

mittausmalli 248—250, 253, 263, 267 

mittausvirhe 245, 251, 266 

modaalisuus 392, 610—611, 624, 902 

monikielisyys, ks. myós kaksikielisyys 214, 
350, 360, 557—558, 565, 568—571, 585-586, 
589, 616, 681, 684, 686, 733, 818, 824, 
864-866, 871, 880—881, 884-886, 888, 
923-924, 949, 951, 956, 959-960, 967, 
970, 974, 986, 998 

monimenetelmäisyys t. monimenetelmäl- 
lisyys 13, 18-19, 29, 83, 105, 108—111, 114, 
142, 148, 151, 193, 350, 944, 964-965, 
969, 973 

monimutkaisuus, ks. myés kompleksisuus 
583-586, 986—987, 991, 1000, 1002, 1011, 
1013 

monismi 64, 72, 75, 80, 83, 133, 444 
metodologinen monismi 75, 80, 82 
ontologinen monismi 82, 113-114 

moniäänisyys 382, 396, 844-845, 851-852 

morfeemi 6, 23, 26, 121, 130, 205, 229, 546, 
566—567, 627—629, 643, 662, 687, 717, 1011 

morfofonologia 60, 205, 607, 643, 736, 
1010, 1012 

morfologia, ks. myós muoto-oppi 26, 120, 
137, 193, 195, 205, 285, 308, 375, 419, 
421-423, 426, 430, 464, 466-467, 493, 
500—501, 505, 546, 561, 566, 578, 582, 584, 
603, 608—612, 629, 640, 643-644, 651, 
660, 666, 681, 687—688, 695-696, 707, 
710, 735, 739, 751, 754—755, 764, 789, 792, 
804, 868, 986-987, 991, 1000, 1010-1014, 
1018 

multimodaalisuus 360, 387, 389, 405, 806, 
823-824, 833-834, 903-905, 910, 924, 
946, 948-949, 952, 966, 973 

muoto-oppi, ks. myós morfologia 193, 
206-207, 279, 375, 609, 737, 751, 755, 762, 
766, 769, 770, 835 

muotti 312 

murre 25-26, 46, 112-113, 147, 201, 207, 
210, 213, 244, 277—279, 281, 283, 285-286, 
289—290, 296, 300, 303-304, 307-308, 
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416-419, 423-425, 443, 462, 464-466, 
532, 538, 550, 552, 558, 564, 566, 569, 680, 
682, 684, 691-692, 694, 707, 709, 711, 
722, 751, 755, 760, 815, 866—868, 872-877, 
879, 882-884, 886-887 


murrekontakti, ks. myós kielikontakti; laina- 


kontakti 570 
muuttuja 14, 59, 112—113, 129, 131, 146, 

148, 260, 264-265, 310—321, 332, 368, 

422—424, 426, 498, 502, 514, 516—518, 

624, 769, 819, 837, 869, 877, 887, 965, 

987, 990, 1004 

kielellinen muuttuja 538, 550 

kielensisáinen muuttuja 463, 877 

kielenulkoinen muuttuja 146, 463, 818, 
869 

riippumaton muuttuja t. tekijä 85, 89, 
987, 991—992, 1010, 1016 

riippuva muuttuja t. tekijä 89, 987, 
991-993 

taustamuuttuja 261, 265, 280, 867, 987, 
998, 1010 

määritelmä 5, 39, 40-41, 49, 51-53, 59, 

61, 67, 72-73, 77, 79, 89, 91-94, 96, 111, 

116, 118, 122, 129, 134, 151, 212, 246, 

266, 268, 284, 365, 445-446, 451, 453, 

455, 558, 561, 651—652, 662, 665, 762, 

778-779, 848 

nominaalimääritelmä 451, 455 

operationaalinen määritelmä 77, 88, 451 

perusmääritelmä 456—457 

reaalimääritelmä 451, 455 


N 

N 400 1006-1007 

narratiivi, ks. myös kerronta; tarina 382, 
396, 1016 

narratiivisuus 276, 389, 393, 822-823, 837, 
971 

nativisoituminen, ks. myös äidinkielistymi- 
nen 580 

nativisti 49 

nauhoite, nauhoitus, ks. myös tallennus; 
äänitys 278, 291, 296, 303, 307, 332, 466, 
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601, 615, 617-618, 620—622, 624-627, 
629, 631, 633, 769, 966, 969-970 
murrenauhoite 289—290 
negaatio 447, 605, 610, 646, 660, 662-663 
nihilismi, ks. myós eliminativismi 71, 82 
nimenosa 807-808, 810, 813-814 
nimeáminen 354, 405, 429, 805, 807-809, 
811, 813-816, 1000, 1008, 1015-1016 
nimeämismalli 816, 825 
nimi 20, 28, 52, 68, 77, 96, 121, 145, 165, 
184-185, 209, 275, 277, 383, 398, 403, 
416, 421, 424-425, 427-432, 443, 449, 
496, 504, 509, 514, 562, 578-579, 625, 
632, 646, 681, 710, 713, 779-781, 789, 
800-825, 877, 885 
eläimen nimi 431-432 
erisnimi 495, 511, 513, 536, 800-801, 
803-804, 810, 823, 951 
etunimi 20, 803-804, 811-812, 822-823, 
825 
kaupallinen nimi 804, 810, 818, 824 
lainanimi 807, 817 
lisänimi 812 
henkilónnimi 185, 681, 801, 803, 805, 807, 
810-812, 816-818, 824-825 
opaakki nimi 804 
paikannimi 4, 416, 564, 619-620, 623- 
624, 681, 709, 801, 803-805, 807-811, 
813, 815-819, 821, 823-826 
slanginimi 819, 821 
transparentti nimi 804 
yleisnimi 44, 426, 501, 511, 513, 801, 803 
nimikategoria 800, 802, 809-810, 813-814 
nimikompetenssi 819 
nimistóntutkimus 195, 305, 681, 779, 800- 
802, 805-806, 821, 826 
nimisysteemi 811-812, 816-818 
nominalisti 49, 68, 72 
nomoteettinen 50—51 
normaalistuminen 957 
normalisointi 537—540, 542—544, 550 
normatiivisuus 2, 4, 7, 39, 44-46, 51, 92, 
95, 105, 131, 151, 201, 206, 211, 269, 457, 
745, 750, 754 


normi t. normisto 2, 59, 63-64, 66, 92, 
94, 127, 129-134, 144, 148, 158, 160-161, 
163-165, 167-168, 171-174, 176, 201, 211, 
213, 215, 223, 246, 260, 347, 350, 354, 
449-450, 562, 849-850, 883, 948, 952 
kielellinen normi 59, 64, 66, 114, 133, 211, 

233 

normijärjestelmä 55, 200-201 

normilause 55 

normipropositio 55 

normittaminen 173, 213, 284, 558, 600, 684, 
803, 999 

nuorgrammatiikka 125, 216, 560—561, 
590-591, 755 

näyte, ks. myös otanta 30, 224, 244, 246, 
258—261, 267—268, 278, 293, 298, 330, 
335, 337, 416, 425, 463, 598, 600-601, 
609-610, 629, 726, 882 


[9] 

objektiivisuus 16, 44, 47, 72, 74, 82, 161, 
216—218, 253, 317, 504, 548, 837, 988, 
1016-1017 

observoijan paradoksi, ks. havainnoijan 
paradoksi 260, 315 

observointi, ks. myós havainnointi 4, 225, 
229 

ohjelma t. ohjelmisto 133, 167-168, 179-183, 
255, 257, 305, 308, 328, 331, 360, 433-434, 
438, 449, 465, 467-468, 472-473, 478- 
479, 494, 498-499, 502—503, 507-513, 
535-536, 540, 542, 551, 630, 633, 716, 768, 
877, 910, 944, 955, 963-964, 973, 996 
annotointiohjelma 429, 630 
korpusohjelma 470, 478, 495, 498, 

535-536, 795 
taulukkolaskentaohjelma 423, 431, 434, 
536 

tietokantaohjelma 425, 431-434 

ohjelmointi 494, 504, 511, 520, 535, 996 

oletus 11-13, 24-25, 39, 62-63, 67, 72-73, 
89, 92, 105, 107-110, 134-136, 138, 146, 
148, 151, 162, 167, 179-180, 221, 250-251, 
263, 265, 280, 349, 363, 394, 399, 423, 


452, 456—457, 492, 516, 571, 577, 584, 589, 
646, 650, 655, 688, 690, 693, 698, 734, 
756, 765, 768-769, 841, 843, 849-850, 
855, 869, 872, 905, 922, 987, 1017-1018 

onomasiologia 443, 801 

onomastiikka 800—802, 804-806, 832, 826 
kansanonomastiikka 806, 821-822 
kontaktionomastiikka 806, 816 
kriittinen onomastiikka 823-824 

ontologia 11, 41-42, 49, 61-63, 65, 67-68, 
71-73, 81-83, 87, 91, 93-94, 98, 108-114, 
129-131, 133-134, 143, 147-148, 151, 349, 
353, 456, 763, 846, 855 

onttinen 61-63, 67, 71-72, 93, 119 

operationalismi 77 

operationalisointi t. operationaalistus 14, 
23-24, 54, 77, 242, 250, 321, 347, 478, 499 

opettaja-oppilasryhmä 744 

ortografia, ks. myös kirjoitusjärjestelmä 
321, 601, 628, 696, 810 

osallistumiskehikko 881, 904, 916, 924 

Oseania 654, 726 

otanta, ks. myös näyte 8, 26, 88, 91, 135, 
245, 258—260, 267—268, 293, 541, 645, 
650, 653-657 
satunnaisotanta 258—259, 261, 292-293, 653 
variaatio-otanta 653 

otos 28, 88, 124, 246, 258, 260-261, 267, 
292-294, 419, 462, 469-470, 488, 490, 
506, 510—511, 577, 589, 640, 642, 646, 
649-650, 652—662, 665, 668, 840, 993 

otoskoko, ks. myós aineiston koko 259, 
655-656, 993 


P 

P600 1006-1008 

paleografia 788, 792 

papyrologia 792 

paradigma 3, 88-90, 150, 489, 519, 584, 
683, 690, 753, 950 

parametri 336, 584, 664, 666 

parseri, ks. myós jásennin 429 

partikkeli 4, 43, 46, 54, 229, 392, 493, 586, 
610—611, 898, 906, 915, 919 
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partikularisaatio 395 

performanssi 219-220, 226, 336, 361 

periodisaatio 539 

periytyminen 663, 691, 705 

persoona 47, 66, 121, 212, 285, 347, 351, 
395-396, 398, 400, 405, 421, 502, 530, 
537-539, 542—543, 545, 548-550, 610, 625, 
683, 696, 712, 753, 760, 767, 872, 877 

perusjoukko 28, 88, 258, 260, 268, 292— 
294, 654, 848 

peruskielioppiteoria t. Basic Linguistic Theo- 
ry 602, 607, 648, 658, 735, 762 

pidginisaatio 866 

pilotti t. pilotointi 33, 254-256, 258-259, 
262, 653, 988, 994, 996, 999, 1008 

pintarakenne 220, 762, 807, 987 

pluralismi 64-65, 72, 82, 105, 114, 777, 793 
ontologinen pluralismi 68, 82, 113-114 

poikkeustapaus 920 

positivismi 75, 78, 174, 216, 381, 726, 729, 
732 

pragmatiikka 91, 136—137, 206—207, 377-379, 
383, 392, 394-394, 421, 463, 551—552, 584, 
588, 613, 647, 669, 787—788, 805, 836 
metapragmatiikka 365 

praktinen syllogismi 81, 120 

preferenssi 84—85, 497, 656, 664, 920 

prestiisi 564, 574—575, 578, 580—581, 586, 
683, 685 

priming 341, 877, 1001 

projektio 324, 908 

propri 801—804, 807, 813, 820, 822-823, 
826 

prosessityyppi 391 

prosodia 317, 332, 464, 466, 607, 804, 
902-903, 905, 910, 917 

prototyyppi 16, 69, 77, 93, 282-283, 447, 
452-453, 455, 764, 779, 849, 999 

prototyyppiteoria 12, 114, 151, 446—447 

psykologia 4, 78, 82, 121-122, 131-132, 
216-217, 219, 243, 246, 248, 252, 257, 270, 
384, 388, 393-395, 404-405, 447, 454, 
528, 643, 651, 765, 768, 840, 949, 963, 
985—986, 988, 1009, 1016-1020 
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diskursiivinen psykologia 384, 388 
sosiaalipsykologia 127, 384, 388, 394-395, 
800 

puheakti 379, 395, 901 

puheaktiteoria 12, 377—378 

puhe 4-7, 12, 20, 24, 26, 32, 40, 46, 51, 53- 
54, 63-64, 66, 71, 107, 118, 123, 128, 133, 
135, 173, 195, 206, 219, 229, 242, 274-275, 
277-280, 282—286, 289—292, 296-297, 
300, 304-306, 313-323, 326—342, 352-353, 
355, 365-366, 377, 379, 386, 388, 392-396, 
400-401, 418, 425, 427, 447, 464-466, 
471-472, 477, 505, 542, 546-548, 569-570, 
596, 607, 620—622, 624—625, 627—628, 
630—631, 633, 683-684, 706, 711, 714-715, 
732, 745, 768, 777, 821, 823, 833, 840, 842, 
851, 869, 872, 877, 881, 884, 887, 897, 
900—903, 906—907, 910, 912, 915-916, 
922, 924-925, 946, 950, 953, 959, 963, 
966, 971, 985, 989, 1000, 1015, 1017-1018 
(huoliteltu) arkipuhe 123, 135, 280-281, 

477, 622, 901 

tavallinen puhe 280-281, 284 

puhe-elin t. puhe-elimistó 25, 217, 314, 
317-318, 321-322, 324-325, 330-331 

puheentunnistus 32, 318 


puheenvuoro 127, 229, 297, 302, 319, 386, 
398-399, 585, 853-854, 900, 902, 905, 
907, 911 

puhekieli 135, 201, 204, 244, 280, 285-286, 
293, 295, 304—305, 395, 542, 711, 767, 
868-869, 871-872, 875, 880-881, 887, 952 

puheyhteisó t. puhujayhteisó 141, 200, 233, 
260, 277, 347-348, 570—571, 580, 586, 
588—590, 628, 643, 651, 661, 669, 685, 
745, 876, 946 

puheääni 174, 316, 320, 330, 335, 632 

purismi 559 

puupankki, ks. myös korpus 467-468 

päättely 27—29, 50, 62, 74, 87, 163, 179, 181, 
213, 443, 448, 624-625, 749, 765, 771 
abduktiivinen päättely t. abduktio 27, 29, 

387 
arkipäättely 899-900 


deduktiivinen päättely t. deduktio 15, 
27-29 

induktiivinen päättely t. induktio 15, 
27-29, 387 


R 

rakenneanalyysi 6, 629, 753, 807, 809, 811 
funktionaalis-semanttinen rakenneana- 

lyysi 807, 809, 813 
syntaktis-semanttinen rakenneanalyysi 
807, 810, 814-815 

rakennetyyppi 232, 419, 640, 643, 645, 647, 
650, 655, 660—661, 663-664, 668, 922 

rationalismi 57, 91, 113, 444, 446, 646 

reaaliaika 145—146, 148, 247, 306, 876-877, 
886-887, 918, 925, 973, 997 

reaalitiede 42, 54—57, 60—61, 73, 83, 87, 94, 
98, 111, 118, 145 

reaktioaika 23, 340, 986—987, 991-993, 998, 
1000-1002, 1008, 1013 

realismi 67—72, 82, 94, 111, 114, 122-124, 
148, 176, 254, 785, 787 
kriittinen realismi 5o, 69, 118 
käsiterealismi 49, 68, 444-446 
rakennerealismi 134 
sademetsärealismi 134 
symbolirealismi 137 

redundanssi 251, 253, 256, 265-266, 584, 
586 

reema 391, 837 

referenssikielioppi, ks. myós kielioppiku- 
vaus 79, 596, 598-609, 611-612, 620, 
658—659, 757 

referentti 49, 53, 69—70, 92, 667, 803, 820, 
905 

refleksiivisyys 226—227, 355-356, 907 

regressioanalyysi 265 

reifikaatio 4, 129-132, 134, 659 

rekisteri 134, 228—229, 302, 350, 352, 354, 
492—493, 499, 502—503, 529, 541, 723, 
779, 836, 866, 886, 971 

rekisteriytyminen 353-356, 886 

rekonstruktio 145, 454—455, 457, 526, 560, 
572, 580, 688, 691, 693, 696, 700-701, 


707, 736, 755 

rekonstruointi 457, 679—681, 688, 691, 693, 
695-696, 700, 707, 717, 736, 741, 789-790 

rekursiivisuus 220 

reliabiliteetti 251 

repertuaari 347, 866, 868, 886 

representaatio 650, 763-765, 1015 

resurssi 10, 22, 174, 292, 347, 351-352, 354, 
380, 392, 476, 571, 745, 824, 846, 886, 
896, 903, 912-913, 917, 919-920, 922, 
925 
kielellinen resurssi 347, 351, 354, 846, 

884-885, 912-913, 916-917, 922-923, 
945 

retoriikka 381, 385, 388, 392, 394-396, 399, 
778-779, 818, 823, 835, 847-848, 850-851, 
952, 971 

retrospektio 963 

revitalisaatio t. revitalisointi, ks. myös kie- 
len elvytys 32, 598-599, 743 

riippumaton tekijä, ks. muuttuja 


riippuva tekijä, ks. muuttuja 
rupattelu 917 


S 

sale 42, 47, 51, 60, 73, 83, 94, 98, 161, 178 

sanajärjestys 427, 500, 526, 578, 640, 
660—662, 664—666, 670, 737-738, 758, 
760, 762, 845 
perussanajärjestys 127, 607—608, 662 

sanalista 281, 322 

sanaluokka 229, 422-423, 460, 465, 467, 
473, 478, 508, 511—513, 533, 602, 606-612, 
737, 753-754, 757-758, 761-762, 803, 810, 
826, 1008, 1010 

sanantunnistus 987, 991, 993, 1000, 
1010-1012 
auditiivinen sanantunnistus 1000 
visuaalinen sanantunnistus 1000, 

1010-1011 

sanasto 125, 277-279, 375, 392-393, 415- 
418, 443, 470, 492-493, 496, 509, 516, 
532, 559-561, 566, 570, 572, 576, 578—583, 
586, 601, 623, 627, 629, 680—682, 684— 
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685, 687, 690—691, 699, 703, 705-706, 
708-717, 722, 726, 730-732, 738-739, 741, 
760, 768, 770, 793, 805, 831, 835, 844, 
846, 849, 872, 958 

sanasujuvuus 1015, 1017 

sarja-asetelma 18 

satunnaistaminen 254, 987 

sekakieli (engl. mixed language) 560—561, 
578, 581—582 

sekvenssi 682, 693-694, 699, 912 

sekventiaalisuus 316, 846, 905-907, 917, 
924-925 

selittäminen 64, 79, 90, 114-116, 119-122, 
127-128, 146, 223, 559-560, 565, 589, 613, 
617, 642, 646—647, 650, 662, 669, 763, 
778, 841, 881 

selitys 3, 7, 11, 24, 29, 43-44, 50-51, 64, 74, 
79-81, 84-87, 89, 105, 111-112, 115, 118— 
120, 122-124, 127-128, 248, 250, 256-257, 
269, 385, 390-396, 445, 456, 502, 504, 
558, 567—568, 570, 573, 575-577, 586—588, 
647—648, 669-670, 850, 875, 877, 880, 
887, 957-958, 994 

selonteko 221, 385, 393-394, 404, 920 

semantiikka 52, 70, 73, 91, 137—138, 151, 193, 
205, 229, 232, 244, 248, 392, 421-423, 
443, 445-447, 450-451, 497, 552, 566, 588, 
647, 669, 687, 753, 763, 765-766, 770-771, 
805, 807, 810, 1012, 1018 
generatiivinen semantiikka 762-763 
konseptuaalinen semantiikka 12, 90, 763 
tulkitseva semantiikka 763 

semanttiset roolit, ks. myös temaattiset 
roolit 422, 478, 1011 

semioosi 147, 347, 354, 824, 833, 843, 854, 
886 
sosiaalinen semioosi 347, 353 

sijanmerkintä 230, 662 

silmänliikemittaus 995, 1002, 1009 

skemaattinen suhde 764 

skopos-teoria 947 

small talk 917 

sosiaalinen konstruktionismi 378, 382, 384 

sosiaalinen verkosto 295, 680, 684, 870 
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sosiokulttuurisuus 353, 391, 598, 600, 814, 
845, 855, 867, 922 
sosiolekti 213, 293, 680 
sosiolingvistiikka 6, 50, 92, 112, 121, 131, 
146, 172, 244, 274-275, 277, 279, 284, 
293, 300, 302, 306, 342, 346, 349-350, 
352—353, 378-379, 383, 528, 530, 539, 549, 
551, 564-565, 569-570, 576, 588-589, 632, 
724-725, 788, 805, 818, 864—875, 877, 
879-880, 882-883, 885-888, 902, 923, 
926 
dekonstruktiivinen sosiolingvistiikka 867 
globalisaation sosiolingvistiikka 346, 886 
historiallinen sosiolingvistiikka 144, 537, 
549-550, 681, 787, 865 
kriittinen sosiolingvistiikka 346 
mobilisaation sosiolingvistiikka 346 
moninaisuuden sosiolingvistiikka 346, 
354 
soveltava sosiolingvistiikka 346 
variationistinen sosiolingvistiikka, sis. 
variationistinen lähestymistapa 294, 
867 
vuorovaikutussosiolingvistiikka 346, 
351-353, 366, 378-379, 871, 881, 923 
spektrogrammi 332, 335—337, 630 
Sprachbund, ks. kieliliitto 
standardi 5, 16, 66, 82, 89, 94, 96, 116, 284, 
296, 685, 689, 866, 867, 884 
standardikieli, ks. myös yleiskieli 754, 879, 
883-884 
standardisoituminen, ks. myös destandar- 
disaatio 957 
stimulus, ks. myös virike 607, 621-624, 627 
strukturalismi 82, 120, 217—219, 354, 382, 
565, 583, 585, 598, 601, 643, 649, 750, 755, 
762, 835, 1018 
substantiivi 17, 48, 66, 119, 129, 421-423, 
426, 467, 511, 513, 544-545, 547, 582, 602, 
608-609, 611-612, 652, 666, 752—753, 
757-758, 761, 803, 999, 1010 
substraatti 147, 564, 570, 573, 575, 581, 583, 
686, 691, 709-710, 741, 817 
sukukieli 60, 145, 307, 560—561, 563, 576, 


582, 587, 589, 598, 607, 611, 613, 654—656, 
680, 694—696, 698—699, 705, 711, 713- 
714, 736, 755 

suodatin 431—432, 436 

suostumus 20, 171, 177, 181, 254, 300, 360, 
618, 660, 908, 986 

suostumuskaavake 618 

superdiversiteetti 886 

superstraatti 564, 574—575, 581, 583 

symboli 63, 137, 225, 349, 514, 756, 763-764, 
789, 879 

symbolinen yksikkó 149, 763, 813 

synkronia 83, 120, 125, 142—145, 217, 219, 
465, 471, 527, 558-559, 565, 568-569, 571, 
574, 589, 647, 654-656, 669, 696, 736, 
755, 759-760, 778, 797, 814, 865, 873, 878, 
907, 971 

synonymia 52, 77, 228, 244, 392, 446, 455, 
490, 499, 507, 511, 724, 845, 865, 955 

syntaksi, ks. myös lauseoppi 193, 206, 211, 
215-216, 218—220, 222, 229, 285, 308, 375, 
384, 392, 417, 419, 421—424, 426—427, 430, 
437, 463—464, 466—468, 478—479, 488, 
491, 493, 499, 501, 503-506, 508, 533, 
547, 561, 566—567, 612, 651, 670, 680-681, 
712-713, 715, 735, 739, 751, 755, 758-760, 
764, 766—767, 804, 807-810, 826, 837, 
847, 869, 872, 901-902, 909, 1007-1008, 
1018 

syvárakenne 220, 762, 764, 807 

sääntö 2, 6, 14, 20, 44-45, 49, 58-59, 64, 
79, 92, 95-97, 106, 112, 115-116, 118, 
120—121, 123-124, 126, 130—134, 138, 
160-163, 173, 178-179, 200, 202, 209-211, 
219, 229, 254, 294, 348, 363, 375, 385, 
387, 391, 393, 396, 446, 531, 573, 584, 586, 
606, 617, 629, 670, 682—683, 688, 694, 
699, 705-707, 711, 714, 717, 750-751, 753, 
755-757, 760, 762, 767, 771, 812, 836-837, 
876, 947, 993, 995 


T 


taggeri 478, 493 
taivutus 128, 206, 421, 425, 500, 507, 526, 


560, 566—567, 582, 584—586, 588, 608, 
610—611, 625, 665, 683, 693, 695, 710, 
712, 755, 792, 804, 1008, 1010-1015 

taivutusluokka, ks. myós deklinaatio 753 

taivutusmuoto 421, 425, 500, 507, 536, 680, 
682, 687, 693-694, 696, 710-711, 1010 

taivutusparadigma 610, 625, 692-693 

taivutustyyppi 207, 224, 682—683, 693, 708 

taksonomia 688, 699 

tallennus, ks. myós nauhoite, nauhoitus, 
äänitys 5, 21, 278, 283-284, 360-361, 412, 
628, 631—632, 734, 910, 963-964, 966, 
973 
kuvaruututallennus 966 
äänentallennus 317-318, 330, 734 

tallennusväline 278, 283-284, 292, 297- 
299, 621, 910, 973 

tarina, ks. myös kerronta; narratiivi 232, 
280, 393, 396, 621—623, 633, 786, 822— 
823, 874, 999, 1016-1017 

tarkekirjoitus, ks. myós transkriptio 6, 304, 
628—629, 733, 910 

taustateoria 4, 9, 11-12, 16, 28—30, 39, 42, 
48, 51, 54, 61, 63, 65, 67, 69, 73, 77, 83, 
88—91, 93-94, 98, 110—111, 116, 126, 148, 
150-151, 161, 252, 446, 456, 802, 1009 

taustatekijà 222—223, 253, 259, 264-265, 
569, 724, 866 

taustatieto 254, 257, 280, 436, 448, 533, 552, 
607, 615, 618, 620, 627—628, 631, 800, 813 

teema 31, 48, 105, 172, 193, 230-231, 276, 
291, 295, 299, 351, 391, 429, 526, 642, 
648, 739-740, 831, 837, 844-845, 854, 
920, 923, 985, 1009, 1012 

tekijänoikeus 21, 181, 469, 472, 535, 618- 
619, 632 

teksti 4-5, 20—21, 32, 50, 63-64, 69, 
76, 92-93, 110, 123, 135, 144, 160-161, 
183-184, 206, 216, 219, 225, 227—228, 230, 
254-255, 280, 295, 305, 322—323, 333, 349, 
357—359, 365, 379-380, 382-383, 387-399, 
414-415, 418, 420, 422, 425, 436, 448-451, 
453-457, 460, 462, 464-466, 468-472, 
475-479, 488-489, 492-493, 495-501, 
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503, 505-508, 511, 513-515, 519, 525-526, 
529—534, 538, 540—543, 545, 552, 572, 578, 
583, 598, 600—602, 609-610, 612, 624, 
627—628, 658—659, 662, 680, 706, 726, 
729, 732, 734-735» 753, 762, 767-768, 
776-778, 780-797, 803-804, 822-824, 
831—855, 866, 917, 926, 943-953, 955-959, 
964—965, 969, 971, 985, 999, 1002-1005, 
1015 
kohdeteksti 946, 950, 956—957, 962, 964 
lahdeteksti 454, 946-949, 952, 955-956, 
958—959, 962, 964, 969 

parateksti 953, 971 

tekstikritiikki 780, 789, 792 

tekstivariantti 786, 788, 790 

tekstilaji, ks. myós genre 21, 144, 194, 382, 
388, 396, 405, 425, 429, 450, 460, 463, 
468, 470, 476, 495, 497, 530, 532-533, 658, 
779, 794, 822—825, 836, 846, 848, 852- 
854, 883, 943, 948, 951, 956, 958, 997 

tekstilingvistiikka 836—837, 844, 947, 950, 952 

tekstintutkimus 147, 178, 182-183, 383, 776, 
781, 831-855, 944, 950—951, 953 

tekstitys 658, 943, 946, 951, 957, 971-973 
ohjelmatekstitys 943, 957 

tekstityyppi 433, 837 

tekstuaalitieteet (engl. textual scholarship) 
792 

temaattiset roolit, ks. myós semanttiset 
roolit 384, 392 

teoretisointi 12, 46, 145, 148, 214, 222 

teoria 2-4, 7, 9, 11-14, 18, 28-29, 39, 46, 
48-53, 55, 59, 61-64, 66-72, 74, 76-80, 
82-83, 88, 90-94, 105, 107-308, 110-111, 
113-115, 122, 129, 139—140, 143, 150—151, 
195, 221, 224, 226, 252, 270, 353-354, 356, 
376, 381—382, 384, 387, 422—423, 435-437, 
443-447, 453, 456, 457, 489, 500, 502, 573, 
602, 640—641, 647—648, 652, 658, 722, 
735, 737, 761, 763-768, 782-783, 835-836, 
839, 848, 850-851, 866, 903, 905, 907, 
948—950, 952, 985, 1001, 1018 

termi 3-4, 7, 11, 32-33, 38-39, 43, 47-49, 
53-54, 57, 59, 62-70, 74, 76-78, 85, 88-93, 
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96, 110-112, 115-116, 118, 123, 127-131, 141, 
147, 151, 172, 183-184, 192, 201, 210, 212, 
215, 217, 230, 246—247, 351, 388, 396, 425, 
443, 446, 451-452, 456, 495, 500, 514—515, 
529, 562, 564, 577-578, 580—582, 608, 
613, 616, 658, 672, 723-724, 735, 738, 750, 
753, 764, 778-780, 850, 866, 902, 942, 
955, 989 

terminologia 5, 33, 72, 92, 94, 96, 108, 170, 
201, 212, 219, 244—247, 280, 320, 418, 
443, 453, 571, 601—602, 605, 613, 623, 
648, 724, 735, 848, 944, 959, 971 

testi 23, 88, 182, 247, 329, 333, 495, 527-528, 
540-541, 543, 548, 550, 626, 668, 769, 
882, 986, 996, 998-999, 1016-1017 
kansandialektologinen testi 247 
kyselytesti 247 
parafraasitesti 247 

tiedeyhteisó 2, 13, 24, 26, 43-44, 47-48, 
52—54, 57, 70, 82, 89, 95, 150, 165, 167, 
261, 268, 364, 641, 888 

tiedonkeruu 240, 243, 733 

tiedosto 255, 266, 298, 305, 360, 465, 472, 
507, 509, 512, 536, 615, 630—631, 874, 910, 
996 

tiedostomuoto t. (tiedosto)formaatti 5, 
298, 360, 507, 615, 628, 630—631, 734, 910 

tieteenfilosofia 1—4, 7, 25, 39, 57—59, 69, 
73-77, 80, 85, 92, 105, 111, 114-115, 127— 
128, 138, 151, 203, 226, 245, 378, 381-382 

tietokanta 33, 332, 413, 415, 417, 419, 
423-425, 431-434, 437, 476, 533, 657, 662, 
715-716, 742, 759, 795, 909 

tieto-oppi, ks. myós epistemologia; tieto- 
teoria 52, 59, 61, 64, 73, 108 

tietosuoja 20-21, 165, 299-300, 469, 908, 
909 

tietosuojalaki 21 

tietoteoria, ks. myós epistemologia 39, 41, 
52—53, 57, 59, 65, 91, 203, 217, 348 

tilastollinen merkitsevyys 364, 496, 540- 
541, 543, 668, 959, 990—991, 993, 996, 
1013-1014 

tilastollinen tarkastelu 994, 996-997 


todellisuus 5, 9, 11, 33, 45, 47-50, 55, 61, 63, 
66, 68-71, 74, 78, 80, 82-84, 86, 88, 108, 
110-111, 113-115, 122-123, 128, 133, 137, 
148, 176, 263, 270, 375, 377, 381-382, 393, 
395, 406, 416, 444, 447, 456, 651, 688, 
738, 752, 807, 835 
ilmitodellisuus 2, 62-63, 70 
reaalitodellisuus 2, 47-48, 56, 66, 69-70, 

118, 123-124, 160, 182, 444, 451 
sosiaalinen todellisuus 133, 376, 382, 870, 
878, 965 

todentaa, ks. myös verifioida 27, 77, 117, 
207, 495, 655-656, 668, 925, 995 

toimintajakso 839, 847, 849, 896, 900, 907, 
919 

toimintayhteisö 141, 347—348, 352, 354, 
357-359, 362, 364, 367-368, 871, 884-885 

toiminto 65, 81, 83, 115, 118, 122, 133-134, 
160, 167, 180, 365, 392, 395-396, 432, 
494-495, 507, 535-536, 625, 705, 820, 
842-843, 846-847, 852, 854, 881, 896, 
898, 900, 903, 907-910, 912, 916-917, 
919-921, 923, 963-964, 989, 1015, 1018 

toistettavuus 47, 50-51, 88, 220, 315, 318, 
364, 462, 476 

topiikki 206, 280, 401, 404, 504—506, 513, 
515-519, 603, 608 

toponomastiikka 802 

totuuden koherenssiteoria 69-70 

totuuden konsensusteoria 70 

totuuden korrespondenssiteoria 69-70, 111 

transkriptio t. transkribointi, ks. myös 
tarkekirjoitus 6, 22, 29, 129, 138, 225, 
304-305, 607, 615, 627—628, 796 

translatorisen toiminnan teoria 948 

triangulaatio 18, 141, 350, 358, 964 

tulke 942, 945, 951, 953, 955, 959, 967, 973 

tulkkaaminen 968 

tulkkaus 194, 781, 942-946, 948-950, 953, 
959, 962—963, 965-971, 973 
asioimistulkkaus 943, 950, 953, 960 
kirjoitustulkkaus 943 
konferenssitulkkaus 943, 949, 953, 


970-971 


kuvailutulkkaus 943, 964 
konsekutiivitulkkaus 943, 953, 971 
oikeustulkkaus 943, 950, 960, 967, 969, 
971 
prima vista -tulkkaus 946 
puhevammaistulkkaus 944 
simultaanitulkkaus 943, 953, 960, 965, 
971 
taktiilitulkkaus 944 
tulkkausprosessi 942, 953 
tulkkausstrategia 950, 953, 967 
tulkki 942, 944, 949-950, 953, 964, 
967-970 
tunniste 184-185, 300, 427, 846 
tunnistetieto t. tunnisteellinen tieto 97, 172, 
181, 184, 632, 908 
tutkijanpositio 348, 350, 361-362, 364, 367 
tutkimus, ks. myös vakiintuneet kielentut- 
kimuksen aloihin viittaavat termit kuten 
diskurssintutkimus; kielentutkimus; kent- 
tätutkimus; nimistóntutkimus; tekstintut- 
kimus; variaationtutkimus; jne. 
aineistopohjainen t. aineistovetoinen tut- 
kimus 13, 140, 263, 412-418, 420-421, 
423, 430-431, 433-435, 437-438, 526 
autoetnografinen tutkimus 969 
eksploratiivinen tutkimus 13, 27—28, 263, 
653, 965 
kielikontaktien tutkimus 147, 557-560, 
564—565, 568, 571, 573—574, 583, 588, 
620, 672, 741 
kieliopillistumistutkimus 146, 437 
konfirmatorinen tutkimus 13, 28, 263 
kuvaileva tutkimus 79, 84-85 
laadullinen tutkimus 4, 11, 13-19, 28-30, 
141, 350, 412-418, 420-421, 423, 430- 
431, 433, 435, 437-438, 461, 545, 551, 
796, 837, 839, 911, 922, 995 
määrällinen tutkimus 11, 13-19, 28-30, 
141, 241, 414, 435, 437, 488-492, 494, 
496, 502, 837, 839, 986, 995 
nimimaisematutkimus 806, 823-824 
näennäisaikatutkimus 146, 876 
näppäintoimintojen tutkimus 964 
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paikannimitutkimus 801, 805 
paneelitutkimus 146, 876 
pilottitutkimus 95, 255, 430, 965 
pitkittäistutkimus 877, 964 
selittävä tutkimus 84-85, 119 
silmänliiketutkimus 23, 964, 971, 1003 
soveltava tutkimus 34, 128, 170, 196, 463, 
837, 922, 924 
survey-tutkimus 244, 260 
tapaustutkimus 13—14, 247—248, 258, 292, 
552, 969, 990, 997-998, 1015 
trenditutkimus 146, 876 
vastaanottotutkimus 971—972 
vuorovaikutustutkimus 770 
ymmärtävä tutkimus 81, 85 
tutkimuskysymys 2-4, 6, 9, 13-15, 18-19, 
23-24, 52, 83, 87, 95, 141, 17O, 224, 
229-230, 233-234, 241—242, 248, 251-253, 
262—264, 266, 268-269, 275, 286, 
292, 294, 296, 346, 361, 386—388, 390, 
414-415, 417, 420, 422, 434—435, 437, 461, 
469, 471-472, 476, 478-479, 489, 496, 
500, 519, 526, 552, 622, 649, 651, 656, 
658—659, 662, 672, 783, 787, 801, 840, 
844, 944, 964, 973, 990, 998, 1009 
tutkimusmateriaali, ks. myös aineisto; 
lähdemateriaali 297, 615, 618, 650, 653, 
655-657 
tutkimusprosessi 8, 10, 20, 43, 47, 86, 172, 
194, 246-247, 252, 356-357, 362-363, 387, 
436, 618, 640, 642, 649, 653, 660, 662, 
669, 672, 909, 912 
tutkimusstrategia 1, 13-14, 18-19, 29 
laadullinen t. kvalitatiivinen tutkimusstra- 
tegia 13, 19 
määrällinen t. kvantitatiivinen tutki- 
musstrategia 14, 19 
tutkimustekniikka 3, 8, 13, 39, 57, 67, 160, 
1020 
tytarkieli 577, 688, 701, 755 
tyyli 228—229, 274, 279-281, 291, 352-353, 
397, 401, 454, 495, 518, 527, 537, 683, 753, 
767, 837, 842, 870, 886, 905, 951, 971 
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U 

uhanalainen kieli, ks. myós kielten uhan- 
alaisuus 32, 164, 244, 596, 598—599, 601, 
608, 617, 626, 657, 742-744, 746, 754, 768 

ulottuvuus 64, 112, 144, 242, 248, 250-251, 
263, 314—315, 324, 326, 333, 335-336, 341, 
346, 351, 361, 368, 514, 541, 564, 659, 
724-725, 731, 742, 766, 794, 836-837, 844, 
850, 877, 883, 920, 953 

universaali, ks. kielen universaali 

uskonto 42, 47-48, 51, 59—60, 73, 75, 83, 
94, 97—98, 418, 538, 606, 615, 680, 705, 
714, 716, 727-728, 743, 779, 946, 951-952 

Uusi-Guinea 579, 586, 615, 657, 661 


V 

validiteetti 88, 251, 604 
ekologinen validiteetti 88, 140, 965, 992, 

1000 

konstruktiovaliditeetti 129 

varaukset (engl. hedges) 392 

Varbrul (monimuuttujamenetelma sosiolin- 
gvistiikassa) 551, 877 

variaabeli, ks. myós muuttuja 351—352, 
538-539, 550, 872, 875, 987, 991 

variaatio 18, 54, 67, 137, 146—147, 201, 205, 
246, 280, 296—297, 338, 346, 350—352, 
450, 468, 471, 519, 598, 617, 639-641, 645, 
647, 649, 651, 653, 660, 662—664, 673, 
679-681, 688, 717, 722, 724, 750, 760, 767, 
792, 806, 818-819, 826, 849, 864-865, 
867—872, 875-877, 880—882, 886-888, 
923, 957, 993, 1005 

variaationtutkimus 275, 279, 284, 296, 
302-303, 305-306, 346, 351-352, 355, 680, 
867-869, 871—873, 875, 879-880, 882 

variantti 351, 425, 469-471, 492, 503, 533, 
538, 550, 680, 780, 791, 811, 868, 872-873, 
875, 883-884 

varieteetti, ks. myós kielimuoto 135, 224, 
284, 351, 466, 488, 564, 569, 574, 579, 
582—583, 585, 589, 621, 684, 866-867, 872, 
884-885, 951 

vastabalansointi 987, 992 


vastausprosentti 259, 261, 267 

vastine, ks. myös kognaatti 66, 69, 167, 
304, 691-692, 694, 714, 727, 753, 885, 957 

verifikationismi 77 

verifioida, ks. myös todentaa 27, 47 

vernakulaari 284 

verrokki 462, 495-496, 503, 509, 511-512, 
987, 992, 998, 1015-1017 

vertailukasite 589, 651-653 

vertailuperusta 642 

vertaistaminen 986, 991-993, 998 

vieruspari 304, 849, 911 

viestintä 14, 30-32, 34, 106, 136, 159, 165, 
180, 194, 206, 316, 319, 321, 340-342, 351, 
358, 382, 384, 386, 396, 414, 505, 656, 750, 
757, 770, 805, 846, 887-888, 943-948, 
967-968, 970 

viitekehys 3, 12, 111, 140, 248, 251, 356, 
365, 603, 646, 669, 787, 793, 995, 1003, 
1018-1019 

viittauskehys 437 

viittomakieli 4, 320, 630, 898, 943, 945, 988 

vinjetti 357, 361 

virike, ks. myós stimulus 276, 622—623, 627 

visualisointi 265, 317-318, 330—331, 464, 
517-518, 536, 542, 544, 551, 734 

vuoro 206, 304, 628, 900-901, 906-908, 
911-912, 915, 917, 919-922, 924-925 

vuorottelu 900, 912, 925 

vuorovaikutuksellisuus 84, 141, 227, 368, 
382, 405-406, 564, 908, 916, 922, 
924-925 

vuorovaikutus 4-6, 20, 25, 31-33, 46, 84, 
87, 106-107, 110, 127-128, 131, 134, 138, 
141, 158, 178, 195, 199, 206-207, 227, 276, 
281, 283, 285-286, 297, 304-305, 346-347, 
349, 351-356, 358-362, 365-368, 374, 
378-379, 382, 389, 392-393, 395, 399-401, 
405-406, 419, 431, 436, 493, 537, 569, 
571, 574, 598, 616—618, 620, 641, 669, 
687, 725, 751, 767, 770, 788, 800, 803, 
805-806, 820, 823, 826, 831, 847-849, 
851—854, 864—865, 867-868, 870-871, 875, 
878, 880—881, 883-887, 896—913, 915-916, 


919-926, 944—946, 949—950, 953, 959, 
966—967, 973-974 
monikielinen vuorovaikutus 881 
vähemmistökieli 164, 575, 617, 657, 684- 
685, 818, 824, 878 
väite 7, 9, 12-14, 24-25, 27, 39, 43, 45-52, 
54-57, 59-62, 68, 70, 72, 76, 80, 84-85, 
88, 93-94, 110, 118, 123, 126, 133, 223, 233, 
242, 250, 446, 530, 585, 608, 661, 665, 
780, 843, 847-848, 852-853, 992 


Y 

yhteisymmärrys 33, 896, 898-899, 922 

yksinkertaistuminen, ks. kielen yksinkertais- 
tuminen 

yksityisyydensuoja 618, 631-632 

yleiskieli, ks. myös standardikieli 55, 143, 
201, 213, 224, 304, 418-419, 423, 433, 
465, 531, 564, 621, 658, 751, 756, 872, 
880-881 

yleistettavyys 7, 16, 18, 44, 49, 49, 52, 124, 
223, 258-261, 267, 364, 438, 488-489, 
589, 616, 733, 925, 965, 1009 

yleistys 15, 28, 74-75, 79, 116, 118, 126, 130, 
135, 140, 146, 260, 331, 571, 602-603, 
640—641, 647, 650—651, 653, 655, 658— 
660, 663, 665, 667, 669—670, 843, 850, 
909, 911 


A 

äidinkieli 6, 18, 199—204, 209, 213, 218, 221, 
223, 226, 233, 248, 254, 259, 262, 264, 
340, 416, 569, 578—583, 585, 599, 621, 750, 
753-754, 837, 958, 985, 991, 1010-1014 

äidinkielistyminen, ks. myös nativisoitumi- 
nen 583 

ärsyke 338-341, 986-988, 992, 994-996, 
1000-1002, 1005-1007, 1009 

äänenlaatu 5, 291, 298, 306, 971 

äänitys, ks. myös nauhoite; tallennus 181, 
278, 303, 329-330 

äännejärjestelmä 67, 125, 145, 206, 607, 
679, 681-682, 684, 698, 706, 740, 744, 
758, 769 
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äännelaki 117, 125, 128, 690—692, 695, 697, 
705 

äänneoppi, ks. myös fonologia 193, 206, 
375, 607, 609-610, 751, 755, 766, 769, 
770, 835 
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äännevastaavuus 560—561, 577, 691-692, 
699, 760 

äänteenmuutos t. äännemuutos 125, 682— 
683, 690, 692-693, 696, 711, 713, 716 


Henkilöhakemisto 


Henkilöhakemisto sisältää tekstissä mainitut viittaukset henkilöihin sekä lisäksi kirjoittajien 
ja toimittajien valikoimia viittauksia kielentutkimuksen eri alojen keskeisten julkaisujen kir- 


joittajiin. 


A 

Aelius Donatus 753 

Agricola, Mikael 419, 462, 694 

Aikio, Ante 686, 708-709 

Aikio, Marjut 878-880 

Andersson, Roger 794 

Apollonios Dyskolos, myös muodossa 
Apollonius Dyscolus 215—216, 753 

Aristoteles 55, 81, 85, 115, 119—120, 444- 
446, 752—753 

Arppe, Antti 19, 109, 111, 225, 492, 653 

Ascoli, Graziadio Isaia 564 

Auerbach, Eric 782 

Austin, John L. 377, 395, 836 


B 

Bacon, Francis 74-75 

Bahtin [Bakhtin], Mihail M. 382, 396, 851 

Baker, Mona 956-957 

Barthes, Roland 382 

Bärtoli, Matteo 564 

Baudouin de Courtenay, Jan 561 

Baudrillard, Jean 82 

Bayer-Hohenwarter, Gerrit 963 

Berger, Peter 378, 382, 835 

Berk-Seligson, Susan 969 

Bhatia, Vijay 850 

Biber, Douglas 479, 492—493, 521, 541, 837 

Bickel, Balthasar 645, 656, 664—665, 668, 
671 

Blommaert, Jan 346—347, 353-354, 368, 378, 
886—887 

Bloomfield, Leonard 135, 218, 564 

Boas, Franz 561, 601, 726-727, 729 

Bogoraz, Vladimir 726 

Bopp, Franz 690, 729, 755 


Broca, Paul 989 
Brodmann, Korbinian 989 
Budts, Sara 548-549 
Bundgaard, Kristine 966 
Butler, Judith 82 


Cc 

Campbell, Lyle 570, 575-576, 687, 718, 746 

Carroll, Ruth 788 

Castagnoli, Sara 959 

Castrén, Matthias A. 645, 728-729 

Chambers, J. K. 244, 277-278, 865 

Chang, Ku-ming Kevin 782 

Chesterman, Andrew 946, 957 

Chomsky, Noam 57-58, 67, 72, 108-110, 
126, 130, 132, 135, 139-140, 217-221, 226, 
350, 446, 643, 648-649, 671, 756—757, 
761-763, 769, 783, 1018 

Ciobanu, Dragos 959 

Comrie, Bernard 603, 644—645, 673 

Comte, Auguste 75 

Conrad, Susan 493 

Copland, Fiona 348, 351, 365-366, 368 

Couper-Kuhlen, Elizabeth 902—903, 905- 
908, 920, 922, 927 

Coupland, Nikolas 353, 867-868, 870, 884, 
888 

Creese, Angela 346, 348, 351, 357, 361, 
365-366, 368 

Croft, William 48, 67, 656, 659, 667, 669, 
673, 768 

Currie, Haver C. 866 

Cysouw, Michael 653, 659, 667-668 
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D 

Dabrowska, Ewa 202, 207, 221-222, 233 

Dahl, Osten 40, 59, 576, 584, 659 

Dam, Helle V. 969, 972 

Darwin, Charles 89, 115, 583 

Davies, Mark 483, 535 

DeKeyser, Robert 1012, 1014 

Deleuze, Gilles 82 

Derbyshire, Desmond C. 661 

Derrida, Jacques 82, 148 

van Dijk, Teun 375, 380, 391, 407, 837 

Dionysios Traakialainen 753 

Diriker, Ebru 970 

Divjak, Dagmar S. 19, 492, 504-505 

Dixon, R. M. W. 421, 602, 648, 673, 735 

Donner, Kai 728 

Drew, Paul 901, 907, 909, 912, 919, 
921-922 

Droste, Filip G. 222 

Dryer, Matthew S. 577, 602, 641, 645, 648- 
649, 654, 657, 666, 670, 673, 759 


E 

Eberhardus Bethunensis 754 

Eckert, Penelope 285, 347, 351, 353, 355, 
868-870 

Einstein, Albert 77, 89, 166, 168 

Elman, Benjamin A. 782 

Enkvist, Nils Erik 781, 836-837 

Etelämäki, Marja 820, 898, 903, 915-916, 
920, 922, 926 

Everett, Daniel 661 


F 

Fairclough, Norman 380—381, 388, 393-394, 
396, 398, 834 

Firth, John R. 219, 414, 496, 836 

Fishman, Joshua 570, 867, 878 

Fodor, Jerry 446, 765 

Foley, William A. 746—747, 757 

Forsman, A. V. 805 

Foucault, Michel 82, 161, 381—382, 836 

French, Peter 905 
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G 

Gadamer, Hans-Georg 81, 161 

Gallup, George 243 

Gardiner, Alan 218, 805 

Garfinkel, Harold 899-900, 906-907 

Genette, Gerard 382, 391 

Gile, Daniel 949—950, 965 

Goffman, Erving 899-900 

Goodwin, Charles 901, 904, 911, 922 

Goodwin, Marjorie Harness 901, 904 

Gordon, Matthew 275, 284—285, 290-291, 
294-295 

Gowases, Tersia 971 

Graffi, Giorgi 645 

Greenberg, Joseph H. 642, 644, 647, 650, 
656, 665-666, 670 

Gries, Stefan Th. 19, 262, 492, 505, 536, 539 

Grimm, Jacob 69, 690, 692, 755 

Gumbrecht, Hans Ulrich 779, 782 

Gumperz, John 350—351, 353, 378, 867 

Gurd, Sean 782 

Göpferich, Susanne 963, 965, 968 


H 

Hahn, Otto 166 

Hakulinen, Auli 211, 304, 659, 750, 756, 
763, 837, 845, 847, 901-902, 905-907, 917, 
919-920 

Hakulinen, Lauri 576, 718 

Hale, Sandra 965, 971, 974 

Halliday, M. A. K. 148, 381, 391, 767, 833, 
836, 845, 866 

Halonen, Mia 355, 883, 920 

Hampton, James 990, 992 


Harjunpää, Katariina 904, 911, 923-924, 
967 

Harjunpää, Mira 754 

Harris, Zellig S. 6, 219, 375, 377, 492 

Hasan, Rugaiya 391, 833, 845 

Haspelmath, Martin 562-563, 572, 641, 
645, 649, 651—652, 657, 670, 673, 706, 
716, 759 

Haugen, Einar 598, 669, 878-879 

Heath, Christian 904 


Heikkilä, Tuomas 32-34 

Heikkinen, Vesa 194, 382—383, 533, 767, 832, 
838, 840, 842-843, 849-850, 855, 954 

Heine, Bernd 562, 575-576 

von Herder, Johann Gottfried 730 

Heritage, John 194, 898-899, 901, 907, 
909, 912, 919-920 

Herlin, llona 765, 926 

Hiidenmaa, Pirjo 832, 834, 841, 850, 855 

Hilpert, Martin 539, 544 

Hiltunen, Risto 788 

Hoey, Michael 848-849 

Hokkanen, Sari 969 

Holmes, James 947 

Holz-Mänttäri, Justa 947—948, 962 

Honkanen, Suvi 846, 849-850, 855 

Honkela, Timo 31 

Householder, Fred W. 215, 753 

von Humboldt, Wilhelm 643, 730 

Hume, David 74-75, 116 

Huovinen-Nyberg, Liisa 837 

Huumo, Tuomas 201, 214, 230—232, 765, 
926 

Hymes, Dell 350—351, 378, 836, 867 

Hakkinen, Jaakko 703, 760 

Häkkinen, Kaisa 195, 416—417, 572, 705, 718, 
759-760 


l 

des, Eberhard Isbrand 730 

kola, Osmo 419, 756, 763 

rigaray, Luce 161 

tkonen, Esa 59, 113-114, 131, 195, 201, 204, 
209, 211, 215, 234, 247, 253, 643, 646, 750, 
752, 771 

vaska, Ilmari 495, 503-504 


J 
ahnukainen, Raili 868 


akobsen, Arnt Lykke 964 
akobson, Roman 565, 644, 787, 943 
antunen, Jarmo Harri 140, 201, 434, 488, 


497, 926 
efferson, Gail 900-901, 910 


Jensen, Kristian T. H. 964 

Jochelson, Vladimir 726 

Jokinen, Arja 195, 384, 407 

Jones, William 690, 729, 754 

Joos, Martin 649 

Joseph, John E. 222 

Juhila, Kirsi 195, 384, 407 

Juvonen, Riitta 837, 846, 848, 852, 854 
Jorgensen, Jens Normann 351, 354, 759, 884 


K 

Kadric, Mira 967, 971 

Kallio, Petri 572, 582, 698 

Kalliokoski, Jyrki 750, 835, 838, 842, 923 

Kannisto, Artturi 728 

Kant, Immanuel 63, 143, 163 

Kantor, Jacob 989 

Karjalainen, K. F. 728 

Karlsson, Fred 3, 17, 112, 150, 195, 203-204, 
206, 211—213, 221, 226, 416—417, 659, 756, 
763, 771, 781, 837, 845 

Katan, David 969 

Katz, Jerrold 446 

Kaufman, Terence 565, 579-581, 587 

Kendon, Adam 901 

Kess, Joseph F. 216 

Kitcher, Philip 45, 77, 89-90 

Kittilä, Seppo 646 

Kivi, Aleksis 794 

Kiviniemi, Eero 804, 807-808, 816, 825 

Klaproth, Julius 730 

Koglin, Arlene 964 

Koivulehto, Jorma 708 

Koivusalo, Esko 837 

Kolehmainen, Leena 196, 589, 759, 952, 954 

Konstenius, Reetta Alexandra 17, 19, 29, 
59, 76, 85, 96-97, 139, 158-159, 169, 174, 
227, 451 

Koponen, Maarit 971-972 

Korhonen, Mikko 60, 645 

Kortelainen, Kristiina 683 

Koskela, Sanni 843, 849 

Koskinen, Kaisa 952, 967, 969-970, 
972-973 
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risteva, Julia 82, 148, 161, 382, 851 
uhn, Thomas 3, 80, 89 
umpulainen, Minna 964-965 
unz, Kerstin 959 

urki, Tommi 277, 286, 302, 306, 872, 
876-877, 882 

usters, Wouter 583, 585, 588 
uteva, Tania 562, 575-576 

übler, Natalie 959 

yröläinen, Aki-Juhani 501-504 
ytölä, Samu 347 

ytömäki, Leena 768 


L 

Labov, William 50, 112, 131—133, 234, 260, 
274, 279-281, 284, 290, 301, 352, 463, 
621, 836, 866, 868-869, 871-872, 875, 
877, 918 

Lacan, Jacques 82 

Lakoff, George 67, 69, 108, 114, 131, 151, 447 

Langacker, Ronald 24-25, 91, 108, 131-132, 

151, 222, 453, 455, 672, 761, 763-765 

Lappalainen, Hanna 150, 244, 285, 822, 

869-870, 876, 880—881, 887, 904, 924 

Lauranto, Yrjó 767, 920 

Laury, Ritva 898, 905, 915-916 

Law, Vivien 754 

Lehmann, Christian 224, 227-228, 751 

Lehtinen, Esa 832, 925 

Lehtinen, Tapani 683, 718 

Lehtisalo, Toivo 728 

Lehtonen, Heini 347, 351, 353-356, 360—361, 

363, 365-366, 571, 870, 881, 885-886, 

888, 926 

Leino, Antti 825 

Leino, Jaakko 765 

Leino, Pentti 417, 764—765 

Leinonen, Marja 646 

Leskinen, Heikki 244, 868 

Levinson, Stephen C. 395-396, 665, 739, 

849, 901, 922 

Lindstedt, Jouko 567, 573, 576, 582, 586—587, 

646 

Local, John 905 
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Lounela, Mikko 194, 382, 533, 840, 843, 
855, 954 

Luckmann, Thomas 378, 382, 835 

Luhtala, Anneli 754 

Luria, Alexandr 989, 1018 

Lüpke, Friederike 686 

Làng, Juha 971 

Lönnroth, Harry 781-782 


M 

Malinowski, Bronistaw 727 

Mann, William 848 

Marlowe, Christopher 795 

Martin, James R. 848—852, 856 

Martschuk, Natalie 971 

Marttila, Annu 646 

Marttila, Ville 534, 794 

Maslova, Elena 656 

McBride, K. E. 1019 

McWhorter, John 580, 584—585, 587 

Meillet, Antoine 565, 691 

Melefors, Evert 794 

Mielikäinen, Aila 244, 279, 868-869, 872, 882 

Miestamo, Matti 6, 195-196, 584, 589, 610, 
640, 644, 646, 649, 651, 653-654, 663, 
665, 759, 952, 954 

Mikkola, Jooseppi J. 708 

Miklukho-Maklai, Nikolai 727 

Mill, John Stuart 79, 85-86, 805 

Mills, C. Wright 406 

Milroy, James 684, 865 

Milroy, Lesley 275, 284—286, 290-291, 
294-295, 865, 870 

Mondada, Lorenza 904, 910-911, 923 

Monzoni, Chiara 905 

Moravcsik, Edith 222 

Mufwene, Salikoko 580 

Mufioz Martin, Ricardo 962, 968 

Muysken, Pieter 560, 570-571, 578 

Myers-Scotton, Carol 571 

Makisalo, Jukka 971 

Mäntynen, Anne 194-195, 382—383, 396, 
407, 835, 839, 843, 849-850, 852, 856 

Moller, Janus 346, 351-354 


N 

Nevalainen, Terttu 537, 539, 542, 550-551, 

553, 865 

Nichols, Johanna 573-574, 585, 590, 645, 

664 

Nida, Eugene 6, 947 

Nietzsche, Friedrich 82, 786 

Niiniluoto, Ilkka 12, 15, 32—34, 40, 43, 47, 

50, 59, 64, 69, 78, 92, 114, 116—118, 123, 

164, 178, 435, 450 

Nikanne, Urpo 136—137, 673 

Nissilä, Viljo 805 

Noonan, Michael 614 

Nordberg, Bengt 302, 869, 871, 873, 875 

Nordlund, Taru 196, 589, 759, 952, 954 

Nuolijärvi, Pirkko 279, 306, 832, 866-867, 
869, 873-874, 876, 880, 882, 884-885, 
952, 958 


0] 

O'Brien, Sharon 954, 963-964, 968, 971, 
974 

Ochs, Elinor 22, 353, 902-903 

Ogden, Richard 905 

Onikki-Rantajääskö, Tiina 765 

Orrego-Carmona, David 972 

Ozolins, Uldis 971 


P 

Pajunen, Anneli 113, 195, 215, 247, 253, 426, 
646, 1010, 1014 

Palander, Marjatta 244, 247, 306, 869, 876, 
882 

Pallas, Peter Simon 730 

Paloposki, Outi 952—953, 970 

Paltridge, Brian 375, 855 

Parpola, Simo 699 

Paul, Hermann 687, 690-691 

Paulsen Christensen, Tina 966 

Paulsen, Geda 763 

Paunonen, Heikki 306, 750, 869, 872, 876, 
884 

Peirce, Charles 110, 148 

Penttila, Aarni 343, 756 


Penttilä, Esa 19, 434 

Perkins, Revere D. 655 

Petraeus, Eskil 754 

Petré, Peter 548-549 

Petrova, Oksana 763 

Pietikäinen, Sari 195, 346, 368, 383, 407, 
835, 843, 856 

Pietinen, Sami 971 

Pike, Kenneth L. 6, 728 

Platon 52, 137, 217, 444-446, 752 

Pollock, Sheldon 782-783 

Popper, Karl 46, 59, 77-78, 113-114, 116, 
132-133 

Prassl, Friederike 963 

Priiki, Katri 244, 247, 877, 881, 887 

Priscianus Caesariensis 753 

Ptolemaiokset 780 

Pyha Birgitta 794 

Póchhacker, Franz 950, 954, 961, 966-967, 
971, 974 

Pórn, Michaela 763 


Q 
Quine, Willard V. 61-62, 71-72, 110 


Quist, Pia 351—353, 884 


R 

Ramat, Paolo 645 

Rampton, Ben 346, 350, 353, 365, 885, 887 

Ramstedt, G. J. 728 

Rasinkangas, Reijo 752 

Rask, Rasmus 690, 729, 755 

Raumolin-Brunberg, Helena 537, 539, 
550—551, 553, 865 

Redi, Francisco 85 

Rice, Karen 163-164 

Rissanen, Matti 477, 532 

Rogers, E. M. 825 

Romaine, Suzanne 550 

Roosevelt, Franklin 166, 243 

Rorty, Richard 213, 835 

Rosch, Eleanor 77, 91, 114, 151, 452—455 

Routarinne, Sara 905 
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S 

Saarikivi, Janne 684, 686, 699, 703, 
708-709 

Sabourin, Laura 1015 

Sacks, Harvey 900-901, 906-907 

Sairio, Anni 465 

Sajnóvics, János 690 

Salmi, Hanna 788 

Salminen, Tapani 645, 702 

Sapir, Edward 565, 644, 738, 755 

Sarasti-Wilenius, Raija 794 

Saukkonen, Pauli 462, 491, 750, 837 

de Saussure, Ferdinand 110, 120, 129-130, 
132, 142-143, 148, 217, 739, 755, 836, 1018 

Savijárvi, Marjo 901, 923 

Schegloff, Emanuel 900—903, 906, 920 

Schiffman, Harold F. 684 

Schjoldager, Anne 966 

von Schlegel, August 643 

von Schlegel, Friedrich 583, 643 

von Schlegel, Wilhelm 643 

Schleicher, August 778 

Schuchardt, Hugo 560-561 

Schütze, Carson T. 139, 203, 221 

Searle, John R. 31, 91, 131—133, 377, 395, 452, 
836 

Seleskovitch, Danica 949 

Selting, Margret 847, 902-903, 905, 907— 
908, 910, 927 

Seppänen, Eeva-Leena 304, 820, 898, 901, 
904, 910, 916, 919, 926 

Seppänen, Minna 195 

Shagal, Ksenia 646 

Shakespeare, William 550, 795 

Shore, Susanna 194, 382, 396, 767, 845, 
847, 849-850, 852, 854, 856 

Silverstein, Michael 353, 870 

Sinnemäki, Kaius 646, 662, 667-670 

Siro, Paavo 756 

Sirola-Belliard, Maija 771 

Sivonen, Jari 136, 765, 926 

Sjögren, Anders Johan 645, 728-729 

Skaffari, Janne 788 

Sokrates 752 
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Stadlober, Johanna 963 

Stern, Ludmila 971 

Stowe, Laurie 1015 

von Strahlenberg, Philip Johan 730 
Stubbs, Michael 497 

Suihkonen, Pirkko 646 

Suoninen, Eero 195, 384, 407 
Sutton, Logan 768 

Szilard, Leo 166 


T 

Tadmor, Uri 572, 706, 716 

Tagliamonte, Sali 295, 504, 877 

Tainio, Liisa 194, 838, 904-905, 922, 927 

Taivalkoski-Shilov, Kristiina 971-972 
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229, 234, 765 

Tandefelt, Marika 878-880 
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Thomason, Sarah 565, 578—581, 587—588, 
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Thompson, Sandra 603, 848, 902-903, 
906-907, 920 

Thomsen, Vilhelm 708 

Tiittula, Liisa 194, 275-277, 838, 880, 952, 
958, 966, 972 

Tognini-Bonelli, Elena 434, 489 

Toivanen, Reetta 684, 878 

Tommola, Hannu 646, 950 

Toury, Gideon 948, 957 

Trevisa, John 788, 791 

Trubetzkoy, Nikolai 561-562 

Trudgill, Peter 244, 277-278, 569, 584, 
586—587, 590, 869, 871 


VW 

Vaattovaara, Johanna 214, 355, 867, 869- 
870, 882-884, 888 

Wahlström, Max 587-588 

Waletzky, Joshua 836 

Van Valin, Robert D. Jr. 757 

Vanhove, Martine 716 

VanPatten, Bill 1012 

Varila, Mari-Liisa 788 


Wegmann, Nikolaus 776, 787, 792 
Weinreich, Uriel 463, 565 

Weisenburg, Theodore 1019 

Werlich, Egon 837 

Vermeer, Hans 947-948 

Wernicke, Carl 989, 1018 

Westermarck, Edward 727 

Whitaker, Harry 989, 1020 

Whorf, Benjamin Lee 562, 738, 755 

Wiik, Kalevi 128, 573, 763 

Wilde, Christopher P. 604, 609, 611 
Viljamaa, Toivo 752 

Vilkuna, Maria 150, 646, 659, 756, 837, 919 
Wilson, Woodrow 243 

Winter, Eugene 848 

Virtanen, Mikko T. 845-848, 851-852, 854 


Wirth, Jessica F. 222 

Visakko, Tomi 347, 353, 838, 848, 850, 855 
Witsen, Nicholaus 730 

Wittgenstein, Ludwig 72, 78, 93, 110, 130, 
132-133, 208-209, 211, 377, 446, 454 
Wodak, Ruth 375, 380, 495 
Wojciechowicz, Katarzyna 767 


Volanschi, Alexandra 959 

Wood, Simon 516 

Voutilainen, Eero 194, 214, 382, 533, 840, 
842-843, 850, 855, 883, 888, 954 
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Kielihakemisto 


Kielihakemisto sisältää teoksessa viitattujen kielten lisäksi myös historialliset kielimuodot, 


rekonstruoidut kantakielet sekä viittaukset kielikuntiin ja kielialueisiin. 


A 

afrikaans 581, 583 

akkadi 736 

alasaksi t. alasaksa 587 

albania 561, 568, 581 

aleutti 582, 740 

altailaiset kielet 562, 728 

anglosaksi 707, 723, 729, 871 

arabia 147, 585, 597, 689 

arjalaiset kielet, ks. indoiraaniset kielet 


B 

Balkanin kielet 147, 561-562, 566, 568, 
576-577, 586-587 

balttilaiset kielet 125, 572, 670, 706—708, 
713 

baski 448, 686, 689 

bulgaria 568, 588 


D 
dravidakielet 575 


E 

englanti 17, 33, 59, 76, 144, 165, 172, 218, 
220—222, 244—245, 260, 290, 347, 352, 
428-429, 462-463, 465-466, 471, 476, 
482, 488-489, 492, 497, 505, 528-529, 
531-532, 535-539, 541-544, 546-547, 
549-550, 564, 566-567, 578-579, 581-582, 
587, 597, 603, 615, 671, 684, 686, 688, 
690, 706-707, 713, 737, 746, 754, 780-781, 
784-785, 788, 796, 824, 834, 850, 875, 
906, 956, 960, 969, 997, 1001 

ersä 698 

ersámordva 694-695 
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esperanto 582—583 
eteláslaavilaiset kielet 561 
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germaaniset kielet 125, 491, 563, 572, 581, 
583, 587, 654, 670, 690, 706—708, 729, 
780, 817 

goemai 623 

guarani 754 
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haitinkreoli 579-580 
hanti 698, 728 

hdi 611 

heetti 686, 708, 736 
heprea 581, 690, 778 
hixkaryana 661 

hollanti 578-579, 581, 587 
hup 611 


l 

inarinsaame 714, 744 

indoarjalaiset kielet, ks. indoiraaniset kielet 

indoeurooppalaiset kielet 144, 562—563, 581, 
583, 611, 654, 688, 691, 700-701, 704, 
708, 729, 736, 755 

indoiraaniset t. indoiranilaiset kielet 572, 
575, 611, 707 

italia 144, 483, 578, 689, 707, 714, 754, 780, 
824, 960 

itämerensuomalaiset kielet 572, 688, 701, 
709 

itäslaavilaiset kielet 567 


| 
japani 739, 754 
jiddis 581 


antabaltti 707 

antagermaani 580, 587, 688, 700, 707, 317 
antaindoeurooppa 690, 708 

antakeltti 688 

antasaame 700 

antaslaavi 572, 688, 700, 706 

antasuomi 125, 143, 688, 692, 695, 698, 
700-701 

antaurali 688, 700—701 

arjala 714-715, 805, 868 

aukasian t. Kaukasuksen kielet 562, 585, 
728 

elttiläiset kielet 587, 686, 755 

etSua 582, 585, 754 

iina t. mandariinikiina 124, 133, 584, 

597, 603, 613, 615, 689, 706, 732, 754, 
1010-1014 

itaani 736 

omi 485, 692, 698, 713-714 

reikka, ks. myós muinaiskreikka 529, 561, 
686, 690, 721, 729, 736, 753-754, 777-778, 
780, 784, 786, 795, arkaainen 736 


L 

latina 65, 131, 144, 529, 566, 580, 584, 586, 
648, 688-690, 706, 717, 729, 753-755, 778, 
780, 784, 788, 791, 793 

liettua 125, 707 


M 

makedonia 568, 588 

mansi 698, 728 

mari, ks. myós niittymari 698, 701 
media lengua 582 

Mednyisaaren aleutti 582 
mon-khmer-kielet 575 

mordva 701 

muinaisegypti 736 
muinaisenglanti 144, 463, 532, 539, 546, 785 
muinaiskirkkoslaavi 754 
muinaiskreikka 793 

muinaisnorja 707 

muinaispersia 755 
muinaisskandinaavi 587 


muinaisturkki 736 
myöhäisuusenglanti 548, 785 
myöhäiskantasuomi 143 


N 
nahuatl 754 
niittymari 692 


P 

papiamento 579 

pararomanikielet 582 

permiläiset kielet 701, 713 

persia 686, 729, 754 

pidgin 147, 560, 578-583, 585, 866 

pidginenglanti 579 

pirahä 661 

pohjoissaame 476, 692, 694—695, 709, 
729, 817 

portugali 485, 535, 579, 732, 780 

puola 688, 700, 754 


R 

räjbanshi 611 

ranska 4, 7, 484, 579-581, 587, 615, 689, 
754, 780-781, 824 

riaunindonesia 608 

romaaniset kielet 561, 563, 578, 580—581, 
583-584, 586, 654, 686, 688, 717, 729 

romania 566, 587 

romanikieli 567, 582 

ruotsi, ks. myös suomenruotsi 347, 357, 
429, 484, 566-567, 572, 582, 585, 684, 
686, 688, 692, 694, 706-707, 710, 713, 
715, 729, 755, 758-759, 794, 817-818, 873, 
879-880, 884, 922-924 

russenorsk 578-579 


S 

saame t. saamelaiskielet 485, 572, 686, 
689—690, 692, 698, 701, 709, 817 

SAE-kielialue (engl. Standard Average 
European) 562—564 

sanskrit 688, 690, 729, 752, 754, 778, 782 

seemiläiset kielet 583 
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serbi t. serbia 688 

skandinaaviset kielet 585, 686, 317, 875 

slaavilaiset kielet 4, 125, 563, 566, 572, 581, 
670, 706, 708 

stadin slangi 582—583, 684, 884 

sumeri 689, 699, 736 

suomalais-permiläinen kantakieli 701 

suomalais-ugrilainen kantakieli 701 

suomalais-ugrilaiset kielet 417, 573, 582, 
670, 700-701 

suomenruotsi 566, 902, 922 

suomi 4, 12, 17—18, 26, 28, 33, 48, 52, 
55-56, 60, 87, 113, 120, 128, 135, 143, 192, 
194-195, 200—201, 203-206, 210-211, 
224, 230, 248, 257, 259, 262, 278—279, 
307-308, 319, 321, 348, 352, 355, 357, 383- 
384, 395, 414, 416-418, 421, 423, 425-426, 
428-429, 433, 448, 462-463, 466-470, 
476, 482, 488, 490-492, 501-503, 505, 
532, 534, 563, 566—567, 576, 582, 598, 607, 
626, 640, 656, 670, 682—690, 692-701, 
705-715, 751-752, 754-760, 763, 767, 
769-771, 784, 803, 805, 811-812, 816-818, 
820, 825, 835, 868, 874, 879-880, 882, 
884-886, 905-906, 909, 916, 956, 1001, 
1010-1014 

swahili t. suahili 585 
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T 

taraski 754 
tiibetiläiskielet 603 
tok pisin 579—580, 615 
turkki 567—568, 686 
tzeltal 623 


U 

udmurtti 485, 713 

ugrilainen kantakieli 701 

unkari 485, 563, 689-690, 692, 698-699, 
705-706, 712 

uralilainen kantakieli 60, 691, 760 

uralilaiset kielet 562—563, 691, 699, 702- 
703, 713-714, 729 


M 

varhaiskantasuomi 701 

varhais-uusenglanti 144, 463, 539, 547 

venäjä 465, 485, 492, 503, 505, 575, 578, 
582, 688, 696, 700, 706, 713, 715, 732, 
1011 

vietnam 575 

viro 204, 485, 683, 688—689, 692, 696—698, 
700, 711-712, 760 


